Google 翻译出现大突破可重现原讲者声音的翻译

最新推荐文章于 2021-12-12 21:46:33 发布

chune2976

最新推荐文章于 2021-12-12 21:46:33 发布

阅读量129

点赞数

原文链接：https://my.oschina.net/u/3884088/blog/3051848

版权

Google 翻译是许多人日常生活中的一个很好的工具，但很少有人知道它实际上是几种工具的组合。

为了在日常生活中实现语音到语音的翻译，通常需要首先将语音识别为文本（语音到文本，STT），然后使用机器学习将文本传输到城市的目标语言，最后阅读文本“Text-to”-Speech，TTS）。这三个过程实际上需要时间来进行计算，每个步骤都有机会犯错，这使得最终的翻译完成。谷歌最近宣布了一种新的Translatotron翻译模型，除了直接的声音到语音翻译外，还可以节省翻译时间并保留原始发言人的声音。

Google正在展示一种新的语音转语音翻译流程，该流程希望打破传统的三阶段瀑布流程：长时间，每一步的累积错误都会导致整体翻译问题。 Translatotron提出了一种分段到网络的网络模型来处理数据，保持说话者的声音和节奏，并提高翻译内容的准确性。

根据Google Research的fun88淘搜网研究，新翻译演算模型的翻译准确性仍然无法与传统的瀑布流程相媲美。但是新型号具有更快操作的优点，并且避免机器发出语音时发出的钝机声。

转载于:https://my.oschina.net/u/3884088/blog/3051848

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。