3.语音增强短时谱估计算法——功率谱减法

谱减法有两种实现方法:幅度谱减法功率谱减法,在该专栏之前的文章中,已经介绍了幅度谱减法的原理,本篇文章将针对于功率谱减法进行介绍(使用的参数与幅度谱减法的参数意义一致)。

假设语音信号与噪声信号不想管,带噪语音信号的功率谱如下:

                                                   \left | Y(\omega ) \right |^{2}=\left | S(\omega ) \right |^{2}+\left | D(\omega ) \right |^{2}

由于噪声平稳,假设发声前与发生期间的噪声功率谱相同,可利用发音前后的、没有语音只有噪声的“寂静帧”来估计噪声。然而语音是非常稳定的,实际上只能利用一小段加窗信号进行分析,用下式表示:

                           \left | Y(\omega ) \right |^{2}=\left | S(\omega ) \right |^{2}+\left | D(\omega ) \right |^{2}+S_{w}(\omega )D^{*}_{w}(\omega )+S^{*}_{w}(\omega )D_{w}(\omega )

式中*表示复共轭,由于d(n)和s(n)互不相关,则互谱的统计均值为0,所以原始语音的功率谱估值如下所示:

                                                  \left | \hat{S}(\omega ) \right |^{2}=\left | Y(\omega ) \right |^{2}-\left | \hat{D}(\omega ) \right |^{2}

当以上差值为负时,则结果令为0。

带噪语音的相位argY(\omega)直接与\left | \hat{S}(\omega ) \right |相乘,可以得到增强后的语音信号:

                                       \hat{S}(\omega )=IFFT\left \{ \left | \hat{S(\omega ) }\cdot exp\left [ jargY(\omega ) \right ] \right | \right \}

功率谱减法的原理框图如下所示:

                      

我的博客即将同步至腾讯云开发者社区,邀请大家一同入驻:https://cloud.tencent.com/developer/support-plan?invite_code=1yqgrvpm3ge84

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值