使用VoiceFliter-Lite改进设备上的语音识别

谷歌推出VoiceFilter-Lite系统,通过实时过滤增强语音特征,优化设备上语音识别,尤其是在重叠语音情况下的性能。该模型大小仅为2.2MB,适用于移动设备,能降低误词率并减少过度抑制问题,适用于嘈杂环境或无互联网连接的情况。
摘要由CSDN通过智能技术生成

正文字数:1896  阅读时长:2分钟

语音辅助技术使用户能够使用语音命令与他们的设备进行交互,并且依靠准确的语音识别来确保对特定用户的响应。但是在许多实际的使用案例中,这类技术的输入一般由重叠的语音组成,这给许多语音识别算法带来了巨大的挑战。

作者 / Wang Quan

原文链接 / https://ai.googleblog.com/2020/11/improving-on-device-speech-recognition.html

2018年,我们推出了VoiceFilter系统,该系统利用了谷歌的Voice Match,通过允许用户注册和登记自己的语音,实现与辅助技术的个性化交互。

https://www.youtube.com/watch?v=TSd080akKUY&feature=youtu.be

虽然VoiceFiltr的方法很成功,并且实现了比传统方法更好的信噪比(SDR),但高效的设备上流媒体语音识别需要解决模型大小、CPU、内存限制和电池使用注意事项和延迟最小化等的限制。

在“Voice Filter-lite方面:针对面向设备上语音识别的流媒体目标语音分离”中,我们推出了针对设备上使用的Voice Filter的更新,该更新可以通过利用选定发言

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值