面向实时交流的全新翻译模型

与传统语音翻译不同,Gemini 3.5 Live Translate 不只是将语音转换成文字后再翻译,而是直接生成自然流畅的目标语言语音。Google 表示,新模型在速度、准确率和语音表现力方面均有明显提升,翻译结果更加接近真人交流体验。

模型支持超过 70 种语言之间的实时转换,可覆盖超过 2000 种语言组合,大幅扩展了跨语言沟通能力。

Google Meet 即将迎来重大升级

Google 同时宣布,Google Meet 的语音翻译功能将升级至 Gemini 3.5 Live Translate。

升级后将带来:

  • 支持 70 多种语言,而此前仅支持少量语言;
  • 支持超过 2000 种语言组合,不再局限于英语与其他语言之间的翻译;
  • 更低延迟的实时语音翻译体验;
  • 更便捷的会议内翻译入口。

该功能本月开始向部分 Google Workspace 企业客户开放私有预览,并计划于今年晚些时候逐步扩大范围。

翻译时保留说话风格

Google 特别强调,Gemini 3.5 Live Translate 可以保留原始说话者的语调、节奏和情感表达,而不仅仅是机械地转换语言内容。

例如在商务会议、在线课程、国际协作以及跨国客户沟通等场景中,听众能够更自然地感受到说话者的表达方式,而非单调的机器配音。

Gemini 正在构建统一语言能力平台

从 Google Translate、Gemini Live 到 Google Meet,Google 正逐步将 Gemini 的语言理解与生成能力整合到整个产品生态中。随着 Gemini 3.5 Live Translate 的推出,实时跨语言交流正从文本翻译进一步迈向语音同传,未来在会议、耳机、移动设备以及 AI 助手中的应用空间值得关注。