#今日论文推荐# ACL 2022 | 中科院计算所、字节等提出:语音翻译新方法 STEMM——跨模态混合训练缓解模态鸿沟
在这个信息全球化的时代,人们能够通过互联网轻松接触到来自世界各地的信息,了解异国他乡的风土人情。然而,语言不通常常成为我们网上冲浪过程中的最大阻碍。幸运的是,近年来迅猛发展的机器翻译技术已经能够在很大程度上帮助人们打破语言屏障,理解各种语言背后的信息。但随着互联网时代信息的呈现方式愈加丰富多样,例如声音、视频、直播等,简单的文本翻译已经不再能够满足人们的日常需求。在这样的背景下,语音翻译技术应运而生。语音翻译,即将一种语言下的语音翻译为另外一种语言下的语音或文字,在当下有着广泛的应用场景:在线外语视频、跨国会议、出国旅游、国际贸易。与文本翻译相比,语音翻译通常面临更多的挑战,如何更准确地进行翻译成为了目前学术界和工业界十分关心的课题。
论文题目:STEMM: Self-learning with Speech-text Manifold Mixup for Speech Translation
详细解读:https://www.aminer.cn/research_report/628c47ef7cb68b460fc039d0?download=falsehttps://www.aminer.cn/research_report/628c47ef7cb68b460fc039d0?download=false
AMiner链接:https://www.aminer.cn/?f=cs