基于MCRA的语音噪音估计

最新推荐文章于 2022-10-21 18:39:08 发布

musiclvme

最新推荐文章于 2022-10-21 18:39:08 发布

阅读量885

点赞数

分类专栏：数字信号处理

本文链接：https://blog.csdn.net/musiclvme/article/details/116273210

版权

数字信号处理专栏收录该内容

4 篇文章 5 订阅

订阅专栏

Minima Controlled Recursive Averaging 噪音估计(MCRA)

MCRA是由Israel Cohen在论文中提出的最小值追踪递归平均法，本文根据此论文总结如何来评估带噪语音中噪音部分，从而可以来做噪音消除任务。

输入信号的时域表示

带噪输入信号公式
$y (n) = x (n) + d (n)$
x(n):语音
d(n):噪音
y(n):语音+噪音

输入信号频域表示STFT

k:频域的频率index
l:时域信号的帧index
M:时域信号的帧移
h(n): 窗函数，窗长为N
$\sum\limits_{n = 0}^{N - 1} {y(n + lM)h(n){e^{ - j(2\pi /N)nk}}} \left[ 1 \right]$

频域假设

现在假设H0(k,l) 表示语音不存在，H1(k,l) 表示语音存在，那么这两种情况下可以如下表示（X(k,l)频域语音，D(k,l)频域噪音）
${H_0}(k,l):Y(k,l) = D(k,l)$
${H_1}(k,l):Y(k,l) = X(k,l) + D(k,l)\left[ 2 \right]$

${\lambda _d}$ 定义， ${a_d}$ 是一个平滑因子，范围在（0,1）之间取值，表示l+1帧的噪音数据和上一帧数据的相关程度；使用 ${\lambda _d} = E\left[ {{{\left( {D(k,l} \right)}^2}} \right]$ 来表示噪音能量值，那么公式2就可以变化成公式3
${H_0}(k,l):{\lambda _d}(k,l + 1) = {a_d}{\lambda _d}(k,l) + (1 - {a_d}){\left[ {Y(k,l} \right]^2}$
${H_1}(k,l):{\lambda _d}(k,l + 1) = {\lambda _d}(k,l)\left[ 3 \right]$

语音存在概率假设 $P (k, l)$

语音存在 $P (k, l)$ ： ${\lambda _d}(k,l + 1) = {\lambda _d}(k,l)P(k,l)$
语音不存在 $1 - P (k, l)$ ： ${\lambda _d}(k,l + 1) = \left[ {{a_d}{\lambda _d}(k,l) + (1 - {a_d}){{\left[ {Y(k,l} \right]}^2}} \right](1 - P(k,l))$
两者相加得到： ${\lambda _d}(k,l + 1) = \left[ {{a_d}{\lambda _d}(k,l) + (1 - {a_d}){{\left[ {Y(k,l} \right]}^2}} \right](1 - P(k,l)) + {\lambda _d}(k,l)P(k,l)\left[ 4\right]$

${\lambda _d}(k,l + 1) = \left[ {{a_d}{\lambda _d}(k,l) + (1 - {a_d}){{\left[ {Y(k,l} \right]}^2}} \right](1 - P(k,l)) + {\lambda _d}(k,l)P(k,l) = {{a'}_d}(k,l){\lambda _d}(k,l) + (1 - {{a'}_d}(k,l)){\left[ {Y(k,l} \right]^2}$

${{a'}_d}(k,l) = {a_d} + (1 - {a_d})P(k,l)\left[ 5 \right]$

能量计算

当前帧的频域能量等于上一帧能量乘以权重 ${a_s}$ + 当前帧能量* $1 - {a_s})$
${a_s}S(k,l-1) + (1 - {a_s})S(k,l )\left[ 6\right]$

局部最小值追踪

现在需要找到每L帧中的最小能量，公式如下

在这里插入图片描述

如何判断语音是否存在

根据当前帧的能量和上一步搜索到的最小能量的比值，这个比值的门限是 $\delta$ ,参考论文取值为5.0
$\frac{{S(k,l)}}{{{S_{\min }}(k,l)}} > \delta\left[ 12\right]$

计算 $P (k, l)$

这里又加入了一个平滑因子，来计算 $P (k, l)$ ，也就是说当前帧的语音存在概率和上一帧语音存在的概率是有一个权重 ${a_p}$
${a_p}P(k,l-1) + (1 - {a_p})I(k,l )\left[ 13\right]$

计算流程总结

参数列表

参数	意义	值
N	频域点数	512
M	时域每帧大小	128
L	最小值追踪窗	125
${a_d}$	噪音频谱平滑因子	0.95
${a_s}$	频谱能量平滑因子	0.8
${a_p}$	语音存在概率平滑因子	0.2
$\delta$	比值门限值，用来确定语音是否存在	5.0

计算流程图
在这里插入图片描述

参考文献

Noise Estimation by Minima Controlled Recursive Averaging for Robust Speech Enhancement 【Israel Cohen, Member, IEEE, and Baruch Berdugo】

musiclvme

关注

0
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
基于MCRA的语音噪音估计

Minima Controlled Recursive Averaging (MCRA)MCRA是由Israel Cohen在论文中提出的最小值追踪递归平均法，本文根据此论文总结如何来评估带噪语音中噪音部分，从而可以来做噪音消除任务。输入信号的时域表示带噪输入信号公式y(n)=x(n)+d(n)y(n) = x(n) + d(n)y(n)=x(n)+d(n)x(n):语音d(n):噪音y(n):语音+噪音输入信号频域表示STFTk:频域的频率indexl:时域信号的帧indexM:时域
复制链接

扫一扫