Google Gemini 3.5 Live Translate 大马发布:支持逾70种语言实时语音翻译,独家“听筒模式”让悄悄话不外泄!

关注我们的 WhatsApp 频道, TikTokInstagram 以观看最新的短视频 - 开箱,测评与第一手新闻资讯。

Google 正式在大马推出了全新的 Gemini 3.5 Live Translate。这是一款强大的实时语音翻译模型:能够支持超过 70 种语言的双向实时同声传译:且翻译延迟仅有短短数秒。然而大马本地实际测试发现,该功能在识别马来语(Bahasa Melayu)时仍偶有偏差:甚至会将“Awak”误识别为“Wah”:并将本地马来语误判为印尼语:显示该模型在本地化适配上仍有一定程度的优化空间。

实时自动语言检测与自然语调保留

根据 Google 官方说明:Gemini 3.5 Live Translate 技术能够自动识别对话中的语言:并在保留原说话者语调、节奏和音色的前提下:生成更加自然流畅的语音翻译。传统的翻译系统通常需要等待说话者完全结束发言后才开始进行翻译:而 Gemini 3.5 Live Translate 则是持续不间断地进行翻译工作:确保对话流畅自然不卡顿。

此外:该模型在音频流式传输的同时进行实时处理:专为嘈杂的复杂环境而设计:即使面对夹杂多种语言的对话:也无需进行任何手动切换设置。

平台适配与独家“听筒模式”

目前该模型已率先在 Android 和 iOS 平台的 Google Translate 应用中上线。用户只需连接耳机:即可享受更顺畅的同声传译体验。针对 Android 用户:Google 还额外引入了独有的“听筒模式”(listening mode)。用户只需像接听普通电话一样将手机贴近耳边:翻译音频便会直接通过听筒播放:在没有携带耳机且不想让旁人听到翻译内容时:该功能显得尤为实用。

开发者、企业端支持与 SynthID 防伪标签

开发者现在可通过 Gemini Live API 和 Google AI Studio 接入此项技术。企业用户方面:Google Meet 将于本月起通过私有预览计划(private preview)提供该功能。在 Google Meet 中:该技术将原本仅支持的 5 种语言大幅扩充至超过 70 种:在单次会议中可支持超过 2,000 种语言组合:彻底打破跨国商务沟通的障碍。

同时:Google 证实该模型生成的所有音频都将嵌入 SynthID 数字水印。这种人类无法察觉的水印能确保 AI 生成的音频内容可被追踪:从而降低虚假信息传播的风险。

虽然这项新功能目前已可在马来西亚使用,但本地化适配依然有待加强。在我们实际测试时,说出“Awak”却被系统识别成了“Wah”,而且本地马来语还被系统误判为了印尼语。看来要完美融入大马人的日常,Google 还需要花点时间来进行本地优化了。

更多科技资讯,继续留守TechNave中文版

大家来评论

Google Gemini 3.5 Live Translate 大马发布:支持逾70种语言实时语音翻译,独家“听筒模式”让悄悄话不外泄!