浅谈掩蔽效应

本文章是基于《MATLAB在语音信号分析与合成中的应用》的读书心得,在此感谢。
掩蔽效应是使一个声音A能被感知的阈值因另一个声音B的出现而提高的现象,其中声音B为掩蔽声,声音A为被掩蔽声。
首先要弄明白什么是被感知的阈值,个人理解就是某个声音能被人耳感知到的最低声压级。以纯音对纯音的掩蔽为例(如下图所示),通过可听阈曲线可以清楚的发现,在没有掩蔽声的情况下,人耳可听到声音A、声音B及声音C的最低声压级为a、b和c。而当掩蔽声出现后,此时人耳可听到声音A、声音B及声音C的最低声压级提高到a’、b’和c’。图中掩蔽阈值曲线表示在该掩蔽声下,声音A、声音B及声音C能被人耳感知的最低声压级。显然,当掩蔽声出现后,本来可以听到的三个声音,变得听不到了。
在这里插入图片描述

一般来说,掩蔽声越强,掩蔽声与被掩蔽声的频率靠得越近,掩蔽效果越明显,当两者频率相同时,掩蔽效果最大。

上述讨论的是掩蔽声和被掩蔽声同时出现的情况,当两者不同时出现时,也存在掩蔽效果,称为短时掩蔽。短时掩蔽分为两种情况,第一种情况是当掩蔽声和被掩蔽声同时存在时,掩蔽声突然消失后,其掩蔽作用也会持续0.5-2s时长,这是由于人耳的存储效应所致。另一种情况是被掩蔽声先出现,相隔0.05~0.2s之内,掩蔽声紧接着出现,它也会对被掩蔽声起掩蔽作用,即人耳至始至终都不会感知到被掩蔽声的存在。

还有一种常见的掩蔽效应是噪声对纯音的掩蔽。该方法是用一个中心频率为f,带宽为△f的白噪声来掩蔽一个频率为f的纯音。刚能掩蔽该纯音的窄带噪声的带宽△f称之为听觉临界频带。这种现象可从听觉生理上找到依据。人耳基底膜可划分成许多很小的部分,每个部分对应一个频率群,可将20~22050Hz频带分为25个频率群(如下表所示)。每个部分的那些频率声音,大脑是叠加在一起进行评价的,如果它们同时发声,可以互相掩蔽。
在这里插入图片描述

研究掩蔽效应,有助于对音色、响度和音高的理解和估计。在语音增强和语音编码中,利用掩蔽效应改善输出语音质量已取得很大的效益,掩蔽效应也可用于改善电动汽车车内的来自电机的高频噪声问题。

  • 3
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
基于Matlab的人耳掩蔽效应语音增强是一种通过模拟人耳的听觉特性来增强语音信号质量的方法。在正常语音通信中,环境噪声和其他干扰声音会降低语音的可听度和理解度。为了改善这种情况,研究者们利用人耳的掩蔽效应原理,设计了一种算法来寻找并提取人耳更敏感的频率范围内的有用语音信息,并削弱其他频率范围内的噪声和干扰声音。 具体来说,基于Matlab的人耳掩蔽效应语音增强算法包括以下几个步骤: 1. 预处理:首先,原始语音信号被传入Matlab环境进行预处理。这些预处理步骤可以包括去除非语音成分、降低噪声和干扰声音等。 2. 音频分析:通过应用短时傅里叶变换(Short-Time Fourier Transform,STFT)将原始语音信号分解为不同时域的频谱分量。每个频谱分量代表了信号在不同频率上的能量分布情况。 3. 掩蔽效应模型:基于人耳的听觉特性,使用合适的音频模型(例如掩蔽模型)来估计人耳在不同频率范围内的掩蔽效应。这个模型会考虑到听觉门限和掩蔽阈值等参数。 4. 频谱增强:基于掩蔽效应模型的估计结果,选择性地增强频谱分量,使得听觉门限上方的频谱成分保留或增强,而听觉门限以下的频谱成分则削弱或抑制。 5. 逆变换和重建:将经过增强的频谱分量进行逆变换,通过加窗和重叠的技术将其合并成为增强后的语音信号。 通过基于Matlab的人耳掩蔽效应语音增强算法,可以有效提高语音信号的可懂度和清晰度,从而提升语音通信的质量。这种方法在语音增强、语音识别和音频处理等领域具有广泛的应用前景。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

天亮继续睡

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值