【深蓝学院:语音信号处理笔记】前端语音处理技术综述
常见设备的语音处理技术
1.手机语音通话降噪
至少俩个麦克风,一个在手机底部,一个在手机顶部。语音通话时,到达底部与顶部麦克风的语音信号有幅度差,一般在6db左右,而噪声到达两个麦克风的幅度几乎没有差别,以此鉴别语音与噪声,消除没有差别的部分。
2.笔记本降噪
基于波束形成技术,增强语音,此时正对笔记本,可以得到比较好的语音在质量,在侧方位声音信号会不同程度抑制
语音处理的一般流程
1.AEC:声学回声消除
2.De-reverb:去混响,去除远场语音通信产生的干扰
3.BSS:(可以单通道可以多通道)盲源分离,去掉干扰人声信号
4.Beamforming:波束形成(多通道):利用空间上的差异,比如到达不同麦克风的幅度差,相位差等等
5.NS:噪声抑制,消除背景噪声
6.AGC:自动增益控制
AEC
解混响
1.盲反卷积法:基于混响是由目标信号卷积房间冲激响应形成的,去估计逆滤波器
- 缺点:无法抵抗噪声干扰,且一个逆滤波器对应一种房间冲激响应。
2.加权预测误差:基于语音具有线性预测特性,即下一帧语音可以由前几帧语音预测到。此算法核心思想为,估计一个最优的线性预测滤波器,可以截短房间响应函数(即iir滤波器拖尾部分带来的晚期混响)。优化过程使得目标函数最小,将当前的预测误差除以信号功率,减小信号幅度对预测误差的影响。
- 应用于多通道场景较好
3.麦克风阵列波束形成,拾取语音入射方向信号,抑制其他方向信号。
4.深度学习:
- masking:学习掩膜
- mapping:直接建立原始信号与目标信号的频谱映射关系