Google 翻译中更稳定的实时语音翻译

Google翻译应用的实时语音翻译功能进行了更新,显著减少了译文修订,提升了用户体验。研究团队通过制定实时翻译评估框架,减少了不稳定性和延迟,同时保持了翻译质量。采用的遮蔽和偏向的推断-时间稳定启发式方法几乎消除了译文修订,实现了高质量和低延迟的实时翻译。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

文 / Naveen Arivazhagan,Google Research 高级软件工程师;Colin Cherry,Google Research 高级研究员

利用 Google 翻译应用中的转录功能,可为会议和演讲等活动创建实时翻译转录,也可以为用您不懂的语言讲述的餐桌故事创建实时翻译转录。在这样的环境中,及时显示译文能够帮助读者更好和更快地理解信息。

  • Google 翻译应用中的转录功能
    https://blog.google/products/translate/transcribe-speech/

然而,在此功能的早期版本中,译文会被多次实时修订,很容易让人分心。这是由于源文和译文之间的非单调关系,其中源文语句末尾的单词会影响译文开头的单词。

转录(旧)- :来自语音识别的源文转录。:显示给用户的译文。对译文频繁修正会干扰阅读体验

今天,我们荣幸介绍 Google 翻译应用中转录功能最新更新背后的一些技术,此次更新显著减少了译文修订并改善了用户体验。有两篇论文描述了实现这一更新的研究。第一篇制定了适合实时翻译的评估框架,并开发了减少不稳定性的方法。第二篇对比其他方法,展现了这些方法的优越效果和等同于原始方法的便捷性。由此产生的模型更加稳定,并在 Google 翻译中明显改善阅读体验。

转录(新)- :来自语音识别的源文转录。:显示给用户的译文。以少量延迟为代价,很少再需要对译文进行修正

  • 第一篇
    https://arxiv.org/abs/2004.03643

  • 第二篇
    https://arxiv.org/abs/2004.03643

   

评估实时翻译

在尝试改进之前,首先要了解并量化衡量用户体验的不同方面,从而在最大限度提高质量的同时将延迟和不稳定性降到最低。在Re-translation Strategies For L

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值