Google DeepMind最强AI手语翻译模型SignGemma 登场,打破手语沟通壁垒!

关注我们的 WhatsApp 频道, TikTokInstagram 以观看最新的短视频 - 开箱,测评与第一手新闻资讯。

Google DeepMind团队于5月27日宣布推出SignGemma,是其迄今为止最强大的手语翻译模型,可将手语转化为口语文本,该开源模型将于今年晚些时候加入Gemma模型家族。SignGemma模型支持多语言功能,但目前主要针对美国手语(ASL)和英语进行了深度优化,开源属性意味着开发者可以自由使用并改进它。

DeepMind 希望通过这一技术,打破手语使用者在沟通上的障碍,让他们在工作、学习和社交中更顺畅地参与。DeepMind 今年还推出Gemma 3n模型,支持从音频、图像、视频及文本输入生成智能文本,助力开发者打造实时互动应用。

此外,Google还与Georgia Institute of Technology及Wild Dolphin Project合作,推出DolphinGemma模型,分析并生成海豚声音,基于巴哈马大西洋斑点海豚的长期研究数据构建。同时,MedGemma模型作为Gemma 3家族新成员,聚焦医疗AI,支持临床推理和医学影像分析,加速医疗与人工智能的融合创新。

资料来源

大家来评论

Google DeepMind最强AI手语翻译模型SignGemma 登场,打破手语沟通壁垒!

| 新闻/资讯 |