文 / Naveen Arivazhagan,Google Research 高级软件工程师;Colin Cherry,Google Research 高级研究员
利用 Google 翻译应用中的转录功能,可为会议和演讲等活动创建实时翻译转录,也可以为用您不懂的语言讲述的餐桌故事创建实时翻译转录。在这样的环境中,及时显示译文能够帮助读者更好和更快地理解信息。
Google 翻译应用中的转录功能
https://blog.google/products/translate/transcribe-speech/
然而,在此功能的早期版本中,译文会被多次实时修订,很容易让人分心。这是由于源文和译文之间的非单调关系,其中源文语句末尾的单词会影响译文开头的单词。
转录(旧)- 左:来自语音识别的源文转录。右:显示给用户的译文。对译文频繁修正会干扰阅读体验
今天,我们荣幸介绍 Google 翻译应用中转录功能最新更新背后的一些技术,此次更新显著减少了译文修订并改善了用户体验。有两篇论文描述了实现这一更新的研究。第一篇制定了适合实时翻译的评估框架,并开发了减少不稳定性的方法。第二篇对比其他方法,展现了这些方法的优越效果和等同于原始方法的便捷性。由此产生的模型更加稳定,并在 Google 翻译中明显改善阅读体验。
转录(新)- 左:来自语音识别的源文转录。右:显示给用户的译文。以少量延迟为代价,很少再需要对译文进行修正
第一篇
https://arxiv.org/abs/2004.03643第二篇
https://arxiv.org/abs/2004.03643
评估实时翻译
在尝试改进之前,首先要了解并量化衡量用户体验的不同方面,从而在最大限度提高质量的同时将延迟和不稳定性降到最低。在“Re-translation Strategies For L