掩蔽效应在语音信号中的应用-CSDN博客

本文链接：https://blog.csdn.net/Leisure_ksj/article/details/104077712

本文章是基于《MATLAB在语音信号分析与合成中的应用》的读书心得，在此感谢。
掩蔽效应是使一个声音A能被感知的阈值因另一个声音B的出现而提高的现象，其中声音B为掩蔽声，声音A为被掩蔽声。
首先要弄明白什么是被感知的阈值，个人理解就是某个声音能被人耳感知到的最低声压级。以纯音对纯音的掩蔽为例（如下图所示），通过可听阈曲线可以清楚的发现，在没有掩蔽声的情况下，人耳可听到声音A、声音B及声音C的最低声压级为a、b和c。而当掩蔽声出现后，此时人耳可听到声音A、声音B及声音C的最低声压级提高到a’、b’和c’。图中掩蔽阈值曲线表示在该掩蔽声下，声音A、声音B及声音C能被人耳感知的最低声压级。显然，当掩蔽声出现后，本来可以听到的三个声音，变得听不到了。
在这里插入图片描述

一般来说，掩蔽声越强，掩蔽声与被掩蔽声的频率靠得越近，掩蔽效果越明显，当两者频率相同时，掩蔽效果最大。

上述讨论的是掩蔽声和被掩蔽声同时出现的情况，当两者不同时出现时，也存在掩蔽效果，称为短时掩蔽。短时掩蔽分为两种情况，第一种情况是当掩蔽声和被掩蔽声同时存在时，掩蔽声突然消失后，其掩蔽作用也会持续0.5-2s时长，这是由于人耳的存储效应所致。另一种情况是被掩蔽声先出现，相隔0.05~0.2s之内，掩蔽声紧接着出现，它也会对被掩蔽声起掩蔽作用，即人耳至始至终都不会感知到被掩蔽声的存在。

还有一种常见的掩蔽效应是噪声对纯音的掩蔽。该方法是用一个中心频率为f，带宽为△f的白噪声来掩蔽一个频率为f的纯音。刚能掩蔽该纯音的窄带噪声的带宽△f称之为听觉临界频带。这种现象可从听觉生理上找到依据。人耳基底膜可划分成许多很小的部分，每个部分对应一个频率群，可将20~22050Hz频带分为25个频率群（如下表所示）。每个部分的那些频率声音，大脑是叠加在一起进行评价的，如果它们同时发声，可以互相掩蔽。
在这里插入图片描述