语音降噪/语音增强的几种算法

概述:现实生活中,语音信号一般都带有噪声,在进一步处理信号前(如语音识别,语音编码),往往要对信号进行降噪,本文介绍几种简单的降噪算法:自适应滤波器/谱减法/维纳滤波法。随着信噪比的减小,降噪方法处理的效果也随之变差,也经常使得语音丢字或者波形失真。如何在低信噪比情况下,达到不错的降噪效果,是一个值得探究的问题。

一. LMS自适应滤波器降噪

1.1. 基本原理

LMS自适应滤波器,利用前一刻已获得的滤波器参数,自动调节当前滤波器参数,以适应信号和噪声未知的或随机变化的统计特性,从而实现最优滤波。

1.2. 原理概述

输入信号序列xi(n),期望输出信号d(n),定义误差信号为:

这里写图片描述

其中wi为权系数。
LMS算法的本质就是寻找最优的权系数wi,使得误差信号e(n)最小。
经过一系列推导,得到权系数的迭代公式:

这里写图片描述

使用最陡下降法,那么LMS算法的关键问题就变为收敛因子 μ 和梯度因子的求解。

(1). 收敛因子 μ 控制收敛的速率,其取值范围:

这里写图片描述

其中 λ 为相关矩阵的最大特征值。当它趋于无穷大,加权适矢量收敛于最优维纳解。

(2).梯度因子

近似计算得到梯度因子表达式:

这里写图片描述

因此权系数最终表达为:

这里写图片描述

1.3. 算法实施步骤

  1. 设定滤波器W(k)初值:
    这里写图片描述

  2. 计算滤波器实际输出的估计值:
    这里写图片描述

  3. 计算估算误差:
    这里写图片描述
  4. 更新k+1时刻滤波器系数
    这里写图片描述
  5. k变为k+1,重复步骤2-4

1.4. MATLAB仿真结果

这里写图片描述

说明: 加入白噪声信号,信噪比设定为snr = 5,降噪前后的信噪比为:
这里写图片描述

二. LMS的自适应陷波器

2.1. 基本原理

自适应陷波器法适用于单色干扰噪声,如单频正弦波噪声,希望陷波器的特性理想,缺口的肩部任意窄,可马上进入平坦区域。

2.2.原理概述

拿有两个权系数的滤波器为例,输入信号为纯语音和单频干扰的叠加:

这里写图片描述

采样后,

这里写图片描述

其中,
这里写图片描述

参考输入为标准正弦波和余弦波的叠加,
这里写图片描述;

x1, x2可以构成任意幅度和相位的正弦波y(n)。
通过LMS自适应系数调整,使y(n)在幅度和相位与原始输入的单频干扰相同,从而清除单频干扰信号,达到陷波效果。

2.3. MATLAB仿真结果

这里写图片描述

说明:加入信噪比为snr = 5的单频噪声,滤波前后信噪比数值大小:

这里写图片描述

三. 基本谱减法

Tip: 由于基本谱减法带来明显噪声残留,需要进行算法改进。

3.1. 基本原理

语音信号处理最常用的方法,在频域进行降噪。

3.2. 算法步骤

这里写图片描述

语音信号对相位不灵敏,将谱减前的相位信息用到谱减后的信号中,在求出谱减后的幅值之后,结合相角,就能用IFFT求出谱减后的语音信号。

3.3. MATLAB仿真结果

这里写图片描述

说明:加入信噪比为snr = 5的白噪声,降噪后听到明显的噪声残留。

这里写图片描述

所以需要在谱减法的基础上做一些改进,传统的方法包括S.F.Boll提出的方法,E.Zavarehei根据其理论写了MATLAB函数 SSBoll79。具体细节这里就先不让谈。

四. 维纳滤波降噪

4.1. 基本原理

维纳滤波器降噪即设计一个数字滤波器h(n),使得输入的带噪语音信号与纯净语音信号的误差满足LMS准则

4.2. 当输入为y(n)时,滤波器输出为:

这里写图片描述

根据最小均方误差准则,要使得:
这里写图片描述

取极小值。
经过一系列推导,得到维纳滤波器谱估计器:
这里写图片描述

引入先验信噪比和后验信噪比,定义:

这里写图片描述
这里写图片描述

谱估计器可以进一步写成:

这里写图片描述
(基于先验信噪比的维纳滤波器谱估计器)
这里写图片描述
(基于后验信噪比的维纳滤波器谱估计器)

引入平滑参数得到先验信噪比和后验信噪比的关系:
这里写图片描述

表明由滴i-1帧的先验信噪比和第i帧的后验信噪比,就可求出第i帧的先验信噪比,一旦已知本帧的先验信噪比,就能导出本帧的维纳滤波器传递函数Hi(k)。
这里写图片描述
进一步可导出维纳滤波器的输出:
这里写图片描述

4.3. MATLAB仿真结果

这里写图片描述
说明: 输入信噪比为10dB的白噪声,降噪前后的信噪比:
这里写图片描述

参考文献

[1]. 宋知用. Matlab在语音信号分析与合成中的应用[M]. 北京:北京航空航天大学出版社:2013.

  • 32
    点赞
  • 407
    收藏
    觉得还不错? 一键收藏
  • 11
    评论
目前,语音降噪算法有很多种。频谱减法有原理简单、容易实现的优点,是 语音降噪的常用算法。但是频谱减法也有如下两个缺点:一是频谱减法性能的好 坏主要依赖于噪声估计,而噪声估计又依赖于端点检测算法。在噪声水平强度高 时,一般的端点检测算法会失效,无法检测出信号中噪声帧的具体位置,从而影 响了噪声估计值的准确性;二是带噪信号经过频谱减法降噪后,由于在谱减时减 去的是同一噪声估计值,就使得信号会随机出现分离的谱区,这些谱区就形成了 容易让人耳听觉疲惫的“音乐噪声”。 针对频谱减法上述的两个缺点,本文对其进行了改进。第一:为了使得噪声 端点检测算法在噪声水平高时也能获得正确的检测,我们求带噪信号的幅度值均 值,并根据这个均值与带噪信号开始数帧的幅度均值大小来判断带噪信号是以噪 声开始还是以带噪语音信号开始。然后根据连续两帧信号的差值的变化来判断噪 声帧和语音帧的起始位置,同时我们在判断的同时把得到的均值做为噪声估计值, 这样既考虑到了连续前后两帧信号的相关性又能够衰减噪声。除此之外,基于本 文改进的噪声端点检测方法的噪声估计值能够在整个带噪语音信号上快速的更新 噪声估计值,提高频谱减法的实时处理能力。第二:为了减少频谱减法所引入的 音乐噪声,我们实现了用 LMS 算法在时域上进行语音增强,来处理谱减后的降噪 信号。LMS 算法能够在降低噪声水平的同时把音乐噪声转换为能量更低的白噪声, 减少了音乐噪声对人耳的刺激,有助于提高处理后的音频的语音质量,提高主客 观评价效果。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 11
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值