语音增强之OMLSA

最新推荐文章于 2023-03-09 14:02:23 发布

373955482

最新推荐文章于 2023-03-09 14:02:23 发布

阅读量5.4k

点赞数 3

分类专栏：语音增强音频处理数字信号处理文章标签： omlsa

本文链接：https://blog.csdn.net/u010592995/article/details/100744196

版权

数字信号处理同时被 3 个专栏收录

29 篇文章

订阅专栏

音频处理

19 篇文章

订阅专栏

语音增强

4 篇文章

订阅专栏

OMLSA

OM-LSA算法，全称为optimally-modified log-spectral amplitude，中文有翻译为“最优改进对数谱幅度估计”，OMLSA算法相比较其它抑制算法有较少的音乐噪声残留（due to its superiorityin reducing musica noise phenomena）
先看系统框图
在这里插入图片描述流程跟其它降噪方法什么不同，信号输入->STFT->噪声估计/增益计算->频谱修改->iSTFT

这里核心部分就是噪声估计然后计算频域增益了，这一步的框图如下
在这里插入图片描述
这里就主要分析增益函数的计算过程

signal model

$y (n) = x (n) + d (n)$

STFT
$Y (k, l) = X (k, l) + D (k, l)$

estimate is obtained by applying a specific gain function to each spectral component of the noisy speech signal
$\hat{X}(k,l)=G(k,l)Y(k,l)$

LSA估计器以最小化下式为优化目标
$E\begin{Bmatrix}(logA(k,l)-log\hat{A}(k,l))^2\end{Bmatrix}{}$
其中， $\hat{A}(k,l))$ 为估计得到的幅度谱

直接给出OM-LSA的表达式如下
$G(k,l)=G_{H_1}(k,l)^{p(k,l)}G_{min}^{1-p(k,l)}$
其中：
$G_{\mathrm{H}_{1}}$ 表示语音存在时候的条件增益
$G_{min}$ 为增益下限，也可以理解为当语音不存在时候的条件增益
$p (k, l)$ 为语音存在概率

继续给出增益函数中的未知量
$G_{\mathrm{H}_{1}}(k, \ell)=\frac{\xi(k, \ell)}{1+\xi(k, \ell)} \exp \left(\frac{1}{2} \int_{\nu(k, \ell)}^{\infty} \frac{\mathrm{e}^{-t}}{t} \mathrm{d} t\right)$

$\xi(k, \ell) \triangleq \frac{\lambda_{x}(k, \ell)}{\lambda_{d}(k, \ell)}$

$\ell) \triangleq \frac{\gamma(k, \ell) \xi(k, \ell)}{1+\xi(k, \ell)}$

$\gamma(k, \ell) \triangleq \frac{|Y(k, \ell)|^{2}}{\lambda_{d}(k, \ell)}$
其中,
$\xi(k, \ell)$ 为先验信噪比（priori SNR）
$\gamma(k, \ell)$ 为后验信噪比（posteriori SNR）