语音信号去混响原理与技术

最新推荐文章于 2025-03-24 15:32:22 发布

晏温

最新推荐文章于 2025-03-24 15:32:22 发布

阅读量1.1w

点赞数 2

文章标签：语音识别+混响

http://read.pudn.com/downloads94/sourcecode/speech/376618/sound/%E8%AF%AD%E9%9F%B3%E4%BF%A1%E5%8F%B7%E5%8E%BB%E6%B7%B7%E5%93%8D%E5%8E%9F%E7%90%86%E4%B8%8E%E6%8A%80%E6%9C%AF.pdf

语音信号去混响技术在通信、语言识别等方面有重要应用。介绍了国内外相关研究动态和方法, 阐述了声音混响过程和倒谱法去混响原理, 简要介绍了传声器阵列- 倒谱法去混响技术。

通常在声音信号采集或录制的情况下, 传声器除了接收到所需要的声源发射声波直接到达的部分外,还会接收声源发出的、经过其它途径传递而到达的声波, 以及所在环境其它声源产生的不需要的声波(即背景噪声)。在声学上, 延迟时间达到约 50 ms 以上的反射波称为回声, 其余的反射波产生的效应称为混响。混响现象将对期望声信号的接收效果产生影响。一些建筑, 如音乐厅和教堂, 需要适度的混响作用而使音乐更加动听。但在许多场合, 混响往往会带来干扰, 导致声学接收系统性能变差。例如, 混响会导致语音识别系统性能显著下降; 在远程会议、免提电话、助听器和移动通信中, 混响作用主要带来负面影响。当混响严重时,这些系统甚至无法正常发挥功能, 因此, 如何减少混响对声音接收系统的影响, 即去混响(dereverberation),是一个非常重要的课题。

按照使用传声器数量分类, 去混响系统主要分为单传声器系统与传声器阵列系统。

单传声器系统去混响技术只利用声场中接收位置一点的声信号时间和变换域的特性。而多传声器阵列系统能利用声场的空间特性, 其主要优点是由阵列带来的接收方向性除了能直接提高信号与混响声能比之外, 同时还对本底噪声有显著的抑制作用。但阵列系统的硬件复杂度高, 数据处理量成倍增加, 对计算速度有较高要求。但随着计算机技术的发展, 采用阵列的去混响技术受到更多重视。

文献[11]提出了两个传声器系统去混响的算法, 利用不同位置上延时混响声的非相关性质通过补偿两个传声器通道之间的相位和幅度差, 将两路信号相关叠加。

文献[12]提出了利用两个相隔足够远传声器信号的倒谱系数差,进行双倒谱迭代重构, 获得通道的倒谱系数并重构源信号的方法。

基于语音模型去混响方法是一种能很好适应语言非平稳性的方法, 其基本点是:混响导致接收的浊音激励脉冲性质变化, 从而影响语音清晰度。