【深蓝学院:语音信号处理笔记】前端语音处理技术综述

【深蓝学院:语音信号处理笔记】前端语音处理技术综述

常见设备的语音处理技术

1.手机语音通话降噪
至少俩个麦克风,一个在手机底部,一个在手机顶部。语音通话时,到达底部与顶部麦克风的语音信号有幅度差,一般在6db左右,而噪声到达两个麦克风的幅度几乎没有差别,以此鉴别语音与噪声,消除没有差别的部分。
2.笔记本降噪
thinkpad笔记本,顶部有两个麦克风
基于波束形成技术,增强语音,此时正对笔记本,可以得到比较好的语音在质量,在侧方位声音信号会不同程度抑制

语音处理的一般流程

在这里插入图片描述
1.AEC:声学回声消除
2.De-reverb:去混响,去除远场语音通信产生的干扰
3.BSS:(可以单通道可以多通道)盲源分离,去掉干扰人声信号
4.Beamforming:波束形成(多通道):利用空间上的差异,比如到达不同麦克风的幅度差,相位差等等
5.NS:噪声抑制,消除背景噪声
6.AGC:自动增益控制

AEC

在这里插入图片描述

解混响

在这里插入图片描述
1.盲反卷积法:基于混响是由目标信号卷积房间冲激响应形成的,去估计逆滤波器

  • 缺点:无法抵抗噪声干扰,且一个逆滤波器对应一种房间冲激响应。

2.加权预测误差:基于语音具有线性预测特性,即下一帧语音可以由前几帧语音预测到。此算法核心思想为,估计一个最优的线性预测滤波器,可以截短房间响应函数(即iir滤波器拖尾部分带来的晚期混响)。优化过程使得目标函数最小,将当前的预测误差除以信号功率,减小信号幅度对预测误差的影响。

  • 应用于多通道场景较好

3.麦克风阵列波束形成,拾取语音入射方向信号,抑制其他方向信号。
4.深度学习:

  • masking:学习掩膜
  • mapping:直接建立原始信号与目标信号的频谱映射关系
语音分离

在这里插入图片描述

波束形成

在这里插入图片描述

噪声抑制

在这里插入图片描述

幅度控制

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值