语音降噪算法

文章探讨了传统双麦克风降噪的局限性,如非平稳降噪效果不佳、鲁棒性差及硬件设计复杂。同时,介绍了AI降噪,特别是中国科技大学的深度神经网络语音增强回归算法,该算法能实现实时人声与环境噪声分离,且不受声源方向限制,提供更鲁棒的降噪效果,适用于各种噪声场景。
摘要由CSDN通过智能技术生成

SNR越低,降噪效果越差
1.LMS自适应滤波器、陷波器降噪
2.普减法
3.维纳滤波降噪
4.双麦克风降噪

双麦克风,一个放在靠近嘴巴的地方收集人声,一个放在顶端或背部收集环境音,再通过算法将人声从背景音中剥离出来,传送到手机的另一端。
缺点:
1)有时用户不再说话时,靠近嘴部的麦克风收集的其实还是环境噪音,对于人声剥离的计算会产生一种断断续续的状况。
2)当用户使用蓝牙耳机或有线耳机通话时,手机端的双麦克风降噪算法往往又会失效。
3)双麦克风在工业设计上也会造成很多阻碍。两个麦克风会让声学音频路径的设计更加复杂,在ODM和OEM角度都会增加生产设计成本。
4)在一些使用场合中,用来收集人声的麦克风不一定会被放在人们的嘴边。例如在录音,或者应用一些App上的对讲机功能时,人习惯将手机放置在桌子上,或者拿在举例嘴略远地方。这时两个麦克风很难接收到不同的声音,让算法起不到作用。
传统的双麦降噪有一定的局限性:
1) .非平稳降噪不理想,地铁中的哨声或路边的噪声等非平稳噪声,双麦降噪算法处理效果差;2).鲁棒性差。当用户处于免提模式或手持手机离嘴稍远时,降噪效果不明显;3).这种传统的双麦降噪在硬件设计上有很大的局限性。
5.AI降噪
1)中国科技大学语音与语言信息处理国家工程实验室
深度神经网络+单麦克风实现主动降噪的论文。具体实现方式是,建立含有噪声+人声和纯净人声的数据集,以深度神经网络为架构训练出分离噪声和人声的“语音增强回归”算法。
在初步试验后,这种算法的结果还不错。从训练成本来看,即使用人工合成的数据,算法结果仍然表现优秀。也就是说算法的应用者不需要面对到现实世界收集数据,可能会侵犯隐私的难题。
从应用上来说,这一算法的降噪能力并不比双麦克模式差,甚至还能克服双麦克风克服不不了的间断噪声问题,有时候人们在走路或跑动时接电话会形成偶尔出现的间断噪声,以往的双麦克风模式很难捕捉到这种噪声,但语音增强回归算法就能将人声从中剥离开来。
优点:
1)更鲁棒的模式,
2)覆盖更广的噪声场景,能够实时分离人声和环境噪声,在任何噪声环境下都能提取出清晰的人声。
3)不需要依靠多个麦克风,鲁棒性强,不受声源方向的限制。即使在用户手持通话时,手机离他的嘴很远,通话是在大仰角下进行的,他也可以毫不费力地与对方通话清楚。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Cynthia.Chen

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值