Google AI博客：使用VoiceFilter-Lite改善设备上数据流式的语音识别

最新推荐文章于 2024-04-25 09:56:42 发布

甲客实验室

最新推荐文章于 2024-04-25 09:56:42 发布

阅读量823

点赞数

分类专栏：科技专栏文章标签： google 谷歌 AI 语音识别语音信号前处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_30404573/article/details/109856685

版权

Google推出了VoiceFilter-Lite，这是一个针对设备上语音识别的流式目标语音分离系统，旨在改善设备在嘈杂或有重叠语音环境中的语音识别效果。该模型仅2.2 MB，可以直接增强语音识别功能，降低重叠语音的字错误率（WER）。通过非对称损失训练和噪声类型预测，VoiceFilter-Lite有效解决了过度抑制问题，提高了语音识别的性能。未来，研究团队计划将其扩展到多种语言并优化语音识别损失。

摘要由CSDN通过智能技术生成

语音辅助技术使用户能够使用语音命令与他们的设备进行交互，它依靠准确的语音识别来确保对特定用户进行响应。但是在许多实际使用案例中，此类技术的输入通常包含重叠的语音，这给许多语音识别算法带来了巨大挑战。在2018年，我们发布了VoiceFilter系统，该系统利用Google的Voice Match通过允许人们注册语音来利用辅助技术进行个性化交互。

Google VoiceFilter 的语音样本处理演示

尽管VoiceFilter方法非常成功，并且比传统方法具有更好的信源失真比（SDR），但在设备上进行流式语音识别仍需要解决诸如模型大小，CPU和内存限制以及电池使用注意事项和延迟之类的限制。

在“ VoiceFilter-Lite：针对设备上语音识别的流式目标语音分离”中，我们介绍了适用于设备上的VoiceFilter的更新，该更新可通过利用选定发言人的注册语音来显着改善重叠语音中的语音识别。重要的是，该模型可以轻松地与现有的设备上语音识别应用程序集成，从而即使在没有互联网连接的情况下，也允许用户在极为嘈杂的条件下访问语音辅助功能。我们的实验表明，一个2.2 MB的VoiceFilte

最低0.47元/天解锁文章

甲客实验室

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Google AI博客：使用VoiceFilter-Lite改善设备上数据流式的语音识别

语音辅助技术使用户能够使用语音命令与他们的设备进行交互，它依靠准确的语音识别来确保对特定用户进行响应。但是在许多实际使用案例中，此类技术的输入通常包含重叠的语音，这给许多语音识别算法带来了巨大挑战。在2018年，我们发布了VoiceFilter系统，该系统利用Google的Voice Match通过允许人们注册语音来利用辅助技术进行个性化交互。 Google VoiceFilter 的语音样本处理演示
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。