语音降噪算法

最新推荐文章于 2024-10-29 19:44:14 发布

Cynthia.Chen

最新推荐文章于 2024-10-29 19:44:14 发布

阅读量5.3k

点赞数 1

分类专栏：语音信号处理

本文链接：https://blog.csdn.net/weixin_38342946/article/details/115319589

版权

语音信号处理专栏收录该内容

8 篇文章

订阅专栏

文章探讨了传统双麦克风降噪的局限性，如非平稳降噪效果不佳、鲁棒性差及硬件设计复杂。同时，介绍了AI降噪，特别是中国科技大学的深度神经网络语音增强回归算法，该算法能实现实时人声与环境噪声分离，且不受声源方向限制，提供更鲁棒的降噪效果，适用于各种噪声场景。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

SNR越低，降噪效果越差
1.LMS自适应滤波器、陷波器降噪
2.普减法
3.维纳滤波降噪
4.双麦克风降噪
双麦克风，一个放在靠近嘴巴的地方收集人声，一个放在顶端或背部收集环境音，再通过算法将人声从背景音中剥离出来，传送到手机的另一端。
缺点:
1)有时用户不再说话时，靠近嘴部的麦克风收集的其实还是环境噪音，对于人声剥离的计算会产生一种断断续续的状况。
2)当用户使用蓝牙耳机或有线耳机通话时，手机端的双麦克风降噪算法往往又会失效。
3)双麦克风在工业设计上也会造成很多阻碍。两个麦克风会让声学音频路径的设计更加复杂，在ODM和OEM角度都会增加生产设计成本。
4)在一些使用场合中，用来收集人声的麦克风不一定会被放在人们的嘴边。例如在录音，或者应用一些App上的对讲机功能时，人习惯将手机放置在桌子上，或者拿在举例嘴略远地方。这时两个麦克风很难接收到不同的声音，让算法起不到作用。
传统的双麦降噪有一定的局限性：
1) .非平稳降噪不理想，地铁中的哨声或路边的噪声等非平稳噪声，双麦降噪算法处理效果差；2).鲁棒性差。当用户处于免提模式或手持手机离嘴稍远时，降噪效果不明显；3).这种传统的双麦降噪在硬件设计上有很大的局限性。
5.AI降噪
1)中国科技大学语音与语言信息处理国家工程实验室
深度神经网络+单麦克风实现主动降噪的论文。具体实现方式是，建立含有噪声+人声和纯净人声的数据集，以深度神经网络为架构训练出分离噪声和人声的“语音增强回归”算法。
在初步试验后，这种算法的结果还不错。从训练成本来看，即使用人工合成的数据，算法结果仍然表现优秀。也就是说算法的应用者不需要面对到现实世界收集数据，可能会侵犯隐私的难题。
从应用上来说，这一算法的降噪能力并不比双麦克模式差，甚至还能克服双麦克风克服不不了的间断噪声问题，有时候人们在走路或跑动时接电话会形成偶尔出现的间断噪声，以往的双麦克风模式很难捕捉到这种噪声，但语音增强回归算法就能将人声从中剥离开来。
优点:
1)更鲁棒的模式，
2)覆盖更广的噪声场景，能够实时分离人声和环境噪声，在任何噪声环境下都能提取出清晰的人声。
3)不需要依靠多个麦克风，鲁棒性强，不受声源方向的限制。即使在用户手持通话时，手机离他的嘴很远，通话是在大仰角下进行的，他也可以毫不费力地与对方通话清楚。