噪声估计方法总结（二）

最新推荐文章于 2022-10-21 18:39:08 发布

myuzhao

最新推荐文章于 2022-10-21 18:39:08 发布

阅读量689

点赞数 1

分类专栏：信号处理基础音频信号处理语音增强文章标签：语音识别人工智能

本文链接：https://blog.csdn.net/suijue9389/article/details/120636311

版权

音频信号处理同时被 3 个专栏收录

22 篇文章 16 订阅

订阅专栏

信号处理基础

16 篇文章 10 订阅

订阅专栏

语音增强

11 篇文章 1 订阅

订阅专栏

噪声估计方法总结

MCRA

MCRA(Minima controlled recursive averaging)算法使用了递归平均和最小值跟踪相结合的方法，这里的最小值跟踪体现在语音存在概率是由最小值跟踪确定的。

递归平滑

在噪声段进行语音平滑处理，在语音段不更新噪声，则，
$\begin{aligned} H_0^{'}(k,l):\hat{\lambda_d}(k,l+1) &= \alpha_d\hat{\lambda_d}(k,l) + (1-\alpha_d)|Y(k,l)|^2 \\ H_1^{'}(k,l):\hat{\lambda_d}(k,l+1) &= \hat{\lambda_d}(k,l) \end{aligned} \tag{1}$

$\alpha_d$ 是平滑参数，数值过大会导致跟踪较慢，数值过小，容易产生音乐噪声。利用条件语音存在概率 $p^{'}(k,l)$ 进行综合，可得，
$\begin{aligned} \hat{\lambda_d}(k,l+1) &= (\alpha_d\hat{\lambda_d}(k,l) + (1-\alpha_d)|Y(k,l)|^2)(1-p^{'}(k,l)) + \hat{\lambda_d}(k,l)p^{'}(k,l) \\ & = \tilde\alpha_d\hat{\lambda_d}(k,l) + (1-\tilde\alpha_d)|Y(k,l)|^2 \end{aligned} \tag{2}$

其中， $\tilde{\alpha_d}=\alpha_d + (1-\alpha_d)p^{'}(k,l)$

最小值控制语音存在概率

首先对幅度谱在频域进行平滑，得，
$S_f(k,l)=\sum_{i=-w}^{w}b(i)|Y(k-i,l)|^2 \tag{3}$

接着在时域进行平滑，
$S(k,l)=\alpha_s S(k,l-1) + (1-\alpha_s )S_f(k,l) \tag{4}$

利用分帧最小值跟踪法求出 $S_{min}(k,l)$ ,
if mod( $\lambda$ ,D) = 0
$S_{min}(k,l)=min(S_{min}(k,l-1),S(k,l))$
$S_{tmp}(k,l)=S(k,l)$
else
$S_{min}(k,l)=min(S_{min}(k,l-1),S(k,l))$
$S_{tmp}(k,l)=min(S_{tmp}(k,l-1),S(k,l))$
end

定义比值 $S_r(k,l)=S(k,l)/S_{min}(k,l)$ ,如果 $S_r(k,l)$ 大于阈值，则令 $I (k, l) = 1$ ,否则为0，条件语音存在概率根据I(k,l)平滑得到，即，
$p^{'}(k,l)=\alpha_pp^{'}(k,l-1) + (1-\alpha_)I(k,l) \tag{5}$

将式(6)带入式(2)得到最终的噪声估计值。

MCRA2

将MCRA算法中最小值跟踪的方法改为连续谱最小值跟踪噪声估计方法，其余部分和MCRA方法一致。即将 $S_{min}(k,l)$ 的估计方法改为，
if $S_{min}(k,l) < S(k,l)$
$S_{min}(k,l)=\gamma S_{min}(k,l-1)+\frac{1-\gamma}{1-\beta}(S(k,l)-\beta)S(k,l-1)$
else
$S_{min}(k,l)=S(k,l)$
end

IMCRA

improved minima controlled recursive averaging (IMCRA)算法是在MCRA算法上做了很多优化。

式(2)中语音存在概率的计算方式进行了改变，改成了和omlsa中一样的方法。
通过控制先验语音缺席概率(而不是语音存在概率)来间接达到最小值控制。
对噪声做了一个偏差补偿
$I (k, l)$ 通过两个不同比率进行判决，更加可靠。

自适应分位数噪声估计

自适应分位数噪声估计使用的是通用形式如下，
$\hat{N}(w,l) = \begin{cases} \hat{N}(w,l-1) + \lambda \delta_+(w,l), |Y(w,l)| \geq \hat{N}(w,l-1) \\ \hat{N}(w,l-1) - (1-\lambda) \delta_-(w,l), |Y(w,l)| < \hat{N}(w,l-1) \end{cases}$

基本思想就是如果当前能量比估计的噪声能量高则增加噪声能量，否则就减少噪声能量，那接下来的重点就是如何设计增加和减少的步长，参考文章[2-3]介绍一些估计的方法，具体可以看文章，这里主要说一下自己对webrtc的自适应分位数噪声估计方法的理解，不一定正确，欢迎指正。

1）对数域平滑
采用对数分位数噪声估计，在对数域进行平滑更新噪声能量,即，
$log(\hat{N}(w,l)) = \begin{cases} log(\hat{N}(w,l-1)) + \lambda \delta_+(w,l), log(|Y(w,l)|) \geq log(\hat{N}(w,l-1)) \\ log(\hat{N}(w,l-1)) - (1-\lambda) \delta_-(w,l), log(|Y(w,l)|) < log(\hat{N}(w,l-1)) \end{cases}$

2）变步长
$density(w,l)=\begin{cases} \frac{count*density(w,l) + 1/(2d)}{count + 1} , |log(\hat{N}(w,l-1)) - log(|Y(w,l)|)| < d \\ density(w,l-1),others \end{cases}$

概率密度 $d e n s i t y (w, l)$ 的更新公式如上式，其中阈值 $d = 0.01$ ，如果当前帧的对数能量和噪声对数能量比较接近,绝对差距小于阈值 $d$ ,则将当前的密度与 $1 / (2 d) = 50$ 进行加权平均(增加当前的概率密度函数的数值)，否则不更新。
$\delta_-(w,l) = \delta_+(w,l)=\begin{cases} \frac{40}{count} , density(w,l)< 1 \\ \frac{40}{count*density(w,l)} ,others \end{cases}$

步长的更新公式如上式，当概率密度达到阈值1后则减少步长，我的理解是在密度达到阈值后，表示在目标值附近，进行精细化搜索。
其中 $c o u n t$ 是从1到200循环计数的，当计数到200则更新噪声估计的值，否则不更新。200是个超参数，至于为什么从小计数到大，我的理解是当 $c o u n t$ 数值小时，步长大，当当 $c o u n t$ 数值大时，步长小，类似于算法收敛一样，先进行大范围搜索，当快达到目标时减少收敛速度，搜索更准确。同时webrtc设置了三种conut的初始值，同时更新，谁先达到200使用谁的结果，增加更新速度，相当于每200/3次更新一次结果。

参考

【1】Stahl V, Fischer A, Bippus R. Quantile based noise estimation for spectral subtraction and Wiener filtering[C]//2000 IEEE International Conference on Acoustics, Speech, and Signal Processing. Proceedings (Cat. No. 00CH37100). IEEE, 2000, 3: 1875-1878.
【2】Tiwari N, Pandey P C. Speech Enhancement Using Noise Estimation With Dynamic Quantile Tracking[J]. IEEE/ACM Transactions on Audio, Speech, and Language Processing, 2019, 27(12): 2301-2312.
【3】Hammer H L, Yazidi A, Rue H. A new quantile tracking algorithm using a generalized exponentially weighted average of observations[J]. Applied Intelligence, 2019, 49(4): 1406-1420.
【4】Cohen I , Berdugo B . Speech enhancement for non-stationary noise environments[J]. Signal Processing, 2001, 81(11):2403-2418.
【5】Rangachari S , Loizou P C . A noise-estimation algorithm for highly non-stationary environments[J]. Speech Communication, 2006, 48(2):220-231.
【6】Cohen I . Noise spectrum estimation in adverse environments: improved minima controlled recursive averaging[J]. IEEE Transactions on Speech and Audio Processing, 2003, 11(5):466-475.

myuzhao

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
噪声估计方法总结（二）

MCRAMCRA(Minima controlled recursive averaging)算法使用了递归平均和最小值跟踪相结合的方法，这里的最小值跟踪体现在语音存在概率是由最小值跟踪确定的。递归平滑在噪声段进行语音平滑处理，在语音段不更新噪声，则，H0′(k,l):λd^(k,l+1)=αdλd^(k,l)+(1−αd)∣Y(k,l)∣2H1′(k,l):λd^(k,l+1)=λd^(k,l)(1)\begin{aligned} H_0^{'}(k,l):\hat{\lambda_d}(k,l+
复制链接

扫一扫