【深蓝学院：语音信号处理笔记】前端语音处理技术综述

今天头秃了嘛

于 2021-12-31 13:53:47 发布

阅读量2.9k

点赞数 1

文章标签：前端语音识别人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xiaojsdhudg/article/details/122253260

版权

【深蓝学院：语音信号处理笔记】前端语音处理技术综述

常见设备的语音处理技术

1.手机语音通话降噪
至少俩个麦克风，一个在手机底部，一个在手机顶部。语音通话时，到达底部与顶部麦克风的语音信号有幅度差，一般在6db左右，而噪声到达两个麦克风的幅度几乎没有差别，以此鉴别语音与噪声，消除没有差别的部分。
2.笔记本降噪
thinkpad笔记本，顶部有两个麦克风
基于波束形成技术，增强语音，此时正对笔记本，可以得到比较好的语音在质量，在侧方位声音信号会不同程度抑制

语音处理的一般流程

在这里插入图片描述
1.AEC：声学回声消除
2.De-reverb:去混响，去除远场语音通信产生的干扰
3.BSS：（可以单通道可以多通道）盲源分离，去掉干扰人声信号
4.Beamforming：波束形成（多通道）：利用空间上的差异，比如到达不同麦克风的幅度差，相位差等等
5.NS：噪声抑制，消除背景噪声
6.AGC：自动增益控制

AEC

在这里插入图片描述

解混响

在这里插入图片描述
1.盲反卷积法：基于混响是由目标信号卷积房间冲激响应形成的，去估计逆滤波器

缺点：无法抵抗噪声干扰，且一个逆滤波器对应一种房间冲激响应。

2.加权预测误差：基于语音具有线性预测特性，即下一帧语音可以由前几帧语音预测到。此算法核心思想为，估计一个最优的线性预测滤波器，可以截短房间响应函数（即iir滤波器拖尾部分带来的晚期混响）。优化过程使得目标函数最小，将当前的预测误差除以信号功率，减小信号幅度对预测误差的影响。

应用于多通道场景较好

3.麦克风阵列波束形成，拾取语音入射方向信号，抑制其他方向信号。
4.深度学习：

masking：学习掩膜
mapping：直接建立原始信号与目标信号的频谱映射关系

语音分离

在这里插入图片描述

波束形成

在这里插入图片描述

噪声抑制

在这里插入图片描述

幅度控制

在这里插入图片描述

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。