学习一篇关于MMSE的语音信号增强的算法

最新推荐文章于 2024-03-18 00:41:27 发布

obession

最新推荐文章于 2024-03-18 00:41:27 发布

阅读量4.7k

点赞数

分类专栏：通信相关

本文链接：https://blog.csdn.net/obession/article/details/49130109

版权

通信相关专栏收录该内容

2 篇文章 0 订阅

订阅专栏

基于高斯分布的 MMSE 语音增强算法估计

帧移：帧移后的每一帧信号都有上一帧的成分，防止两帧之间的不连续。语音信号虽然短时可以认为平稳，但是由于人说话并不是间断的，每帧之间都是相关的，加上帧移可以更好地与实际的语音相接近。

加窗：由于直接对信号（加矩形窗）截断会产生频率泄露，为了改善频率泄露的情况，加非矩形窗，一般都是加汉明窗，因为汉明窗的幅频特性是旁瓣衰减较大，主瓣峰值与第一个旁瓣峰值衰减可达40db。

频谱泄露（截断效应）：信号为无限长序列，运算需要截取其中一部分（截断），于是需要加窗函数，加了窗函数相当于时域相乘，于是相当于频域卷积，于是频谱中除了本来该有的主瓣之外，还会出现本不该有的旁瓣，这就是频谱泄露！为了减弱频谱泄露，可以采用加权的窗函数，加权的窗函数包括平顶窗、汉宁窗、高斯窗等等。而未加权的矩形窗泄露最为严重。频谱泄露就是分析结果中，出现了本来没有的频率分量。

先验信噪比：先可以是方差，一阶统计量是均值，二阶统计量方差对应能量，但是具体计算的时侯不一定非得用方差。
后验观测信号的能量（signal+noise）与noise能量的比值，当然这个noise的能量是你估计出来的，只是一个估计值。。。
就是比如你观察到的信号是 signal+ noise，此时的signal 与noise的能量比就是先验信噪比，当然一般算的是signal的估计值与noise的估计值的能量比。
当然这个值是根据你的观测矢量算出来的。那还有一个后验的信噪比，指的是观测信号与noise的能量比。