语言 复合三点中值滤波_Chapter5|5.23 谱音高模型和复合音的音高

本文深入探讨了谱音高模型,解释了纯音的音高感知如何受到声压级和部分掩蔽的影响。通过谱音高模型,详细分析了纯音的频率音高计算,并介绍了复合音的音高,尤其是谐波复合音和非谐波复合音在不同条件下的音高特性。同时,揭示了音高偏移如何与声压级和部分掩蔽相关联,并通过实例展示了音高计算的数学表达式。
摘要由CSDN通过智能技术生成

5.2 谱音高模型

对于纯音,可以根据相应的掩蔽模式建立谱音高模型。如5.1节所述,纯音的音高不仅取决于它们的频率,还在一定程度上取决于它们的声压级和存在的部分掩蔽音。“纯音的音高”感知可以用声压级40dB的纯音的频率(一个物理值)来描述,它产生的音高与所讨论的纯音的音高相同。这个值称为“频率音高”,HF。一个纯音的总音高偏移v可分为两个分量:一个分量vL归因于对音高的声压级依赖性,另一个分量vM归因于部分掩蔽,其中 

用音高单元(pu, pitchunit)给出的纯音的频率音高HF可按下式计算 

其中fT为用Hz表示的纯音频率。对(5.2)的研究表明,一旦知道了相应的音高偏移,就很容易得到纯音的频率音高。因此,接下来,根据掩蔽模式来计算音高偏移。

纯音的谱音高模型的基本特征如图5-7所示,图中显示了一个掩蔽声音M的掩蔽模式,以及测试纯音T的掩蔽模式,为此需要计算谱音高。另外,静音阈值THQ以虚线形式给出。测试纯音的谱音高可以基于相应的掩蔽模式用三个不同级别来描述。第1级为用ΔMPTM表示,表示测试纯音(T)的掩模模式与掩蔽声(M)的掩模模式在测试纯音的临界频带下的差异。第2级包括两个分量:分量“2a”表示掩蔽声在低于测试纯音的临界频带1Bark区域中产生的掩蔽模式的斜率sMPM。另一个分量“2b”表示静音阈值的斜率,也是在测试纯音的临界频带以下的1个临界频带区域。第3级是用ΔMTHQ表示,表示掩模声在测试纯音的临界频带处的掩蔽模式与在此临界频带处的静音阈值之间的差异。

28f14b760a582f822524bc9da881f8e8.png

图5-7 谱音高模型。测试纯音(T)、掩蔽声(M)和静音阈值(THQ)的掩蔽模式。关于级别1、2a、2b和3见文中内容

作为第一个例子,由纯音声压级的变化所产生的音高偏移将用谱音高模型来描述。在这种情况下,图5-7所示的模式被大大简化了,因为不存在掩蔽声(M),只需要考虑测试纯音(T)的掩蔽模式。在这种情况下,级别“3”不存在,而级别“1”包含了测试纯音(T)的掩蔽模式顶部与测试纯音的临界频带下的静音阈值之间的整个区域。此外,在这个特殊情况中,只需要考虑分量“2b”。因此,纯音由其声压级引起的音高偏移可以根据其掩蔽模式在绝对阈值以上的高度和在测试纯音的临界频带以下的1Bark区域中的绝对阈值的斜率来计算。对应的公式如下:

182d8dfd5b95243f9529a36b84c2567d.png

其中vL,根据(5.1),是由声压级引起的音高偏移。计算由部分掩蔽声引起的纯音的音高偏移要复杂一些,因为级别3也要考虑进去。音高偏移vM的值可以计算为三个因子的乘积,每个因子与图5-7中表示的级别1、2和3中的一个因子以及一个附加常数相关。

结果用以下公式表示: 

函数g1描述了在测试纯音的临界频带下,纯音的音高偏移依赖于测试纯音的掩蔽模式和掩蔽声的掩蔽模式之间的差异。相应的公式为 

第二个函数g2依赖于掩蔽声的掩蔽模式的斜率和静音阈值的斜率,两者都在测试纯音的临界频带以下的1个临界频带区域。对应的公式为:

6757ded0a5d257bac01999d9c30be623.png

第三个函数g3表示在测试纯音的临界频带下,掩蔽声的掩蔽模式和静音阈值之间的差异。通过区分三个不同的声压级范围最易于描述

edecca78ee5f9000fd3642d40531b205.png

虽然图5-7所示的图形可能定性地说明谱音高模型背后的“哲理”,但上面公式中给出的定量实现是通过尽可能多地拟合来自文献的数据优化出来的。

5.3 复合音的音高

复合音可以看作是几个纯音的叠加。如果纯音的频率是同一个基频的整数倍,则产生的复合音称为谐波复合音。尽管复合音包括几个纯音,但复合音在日常生活中比纯音更频繁常见。例如,人类语言中的元音或许多乐器发出的声音都是谐波复合音。

复合音的音高可以通过纯音的音高匹配来评估。虽然复合音包含许多纯音,但它们通常不会产生许多音高,而是产生一个单一的或可能是一个显著的音高。从根本上说,在谐波复合音中,复合音的音高对应于一个频率,这个频率非常接近各谐波分量之间的频差,即基频。然而,仔细观察就会发现,这一规律存在细微但系统性的偏差。图5-8给出了一个例子,其中匹配音高的纯音与谐波复合音的基频之间的相对频差作为对应基频的函数给出。从基频开始,复合音包含所有幅值相等在500Hz以下的谐波,在更高的频率处,其频谱计权为-3dB/倍频程。谐波复合音的Overall Level为50dB,匹配纯音的声压级通常为60dB,但在频率低于100Hz时,则为70dB。图5-8所示的结果表明,对于1kHz以下的基频,相对频差随着基频的减小而逐渐减小。例如,60Hz的差异几乎达到-3%,即一个频率为58.2Hz的纯音产生的音高与基频为60Hz的谐波复合音的音高相同。在400Hz基频下,相对频差约为-1%,即396Hz的纯音与基频400Hz的复合音产生相同的音高。对于1kHz以上的频率,纯音的频率和复合音的基频的音高是相等的。

d37349186e88bd9eb2bb115534e1962c.png

图5-8复合音的音高。相同音高的纯音和复合音的基频之间的相对频差作为基频的函数。复合音的Overall Level为50dB,纯音为60dB

谐波复合音的音高取决于声压级。图5-9显示了一个基频为200Hz的复合音的音高偏移,它是其声压级的函数。随着复合音声压级的增加,音高负偏移也越来越大。图5-3描述的低频纯音也有类似行为。这表明,一个复合音的音高是基于其低频分量的谱音高。这一结果与图5-8所示的数据相吻合,表明纯音的频率低于同音高的复合音的基频。一种解释是,从图5-6中显示的数据可以看出,复合音的基频通过二次谐波向更低频率偏移。

c75b695cf191b60056fdbb3ce5b22500.png

图5-9复合音的音高偏移是声压级的函数。其基频为200Hz,匹配纯音的声压级为50dB

如果把较低的谐波从复合音中移除,音高几乎不会改变。这就意味着没有基频的(不完整)谐波复合音的音高通常与其基频的音高密切相关。复合音中剩余的高次谐波产生一个与低频(基频)相当的音高,这种效应被称为残余音高、低音高或虚音高。

并不是所有低次谐波被移除的复合音都能引出虚音高。相反,为了产生虚音高,必须对基频和最低分量的频率进行特定的组合。可以定义一个虚音高存在区域,如图5-10所示。它表明一个复合音的基频作为最低分量的函数,在最低分量之下,所有的频谱成分都被移除。为了产生虚音高,必须给出图5-10阴影区域内的谱分量。

70b78daf734a185466822ed296573f50.png

图5-10虚音高的存在区域。基频作为最低频率分量的函数。阴影区:必须包含不完整的线谱成分以产生虚音高

图5-10所示的结果表明,无论基频是多少,最低频率分量在5kHz以上的复合音都不会产生虚音高。在较低的基频,如谱线间距更紧密,在更低的频率处实现这一限制。例如,只有最低谱线的频率不超过1kHz时,基频为50Hz的复合音才会产生虚音高。这意味着只有低次谐波到第20次谐波才能产生虚音高的感知。

不完整谐波复合音的音高的评定方法与完整谐波复合音的音高的评定方法相同。与图5-8中显示的完整复合音的数据一样,不完整复合音也显示出负的相对频差,但是这个负值要大大约两倍。不完整复合音的音高与声压级的关系也可以从最低谱分量的声压级关系中推导出来。因此,如果最低分量在3kHz左右,那么音高偏移会随着声压级的升高而增大,与图5-9中显示的完整的复合音的数据形成对比。

它不是通过高通滤波移除谐波复合音中的某些频谱成分,而是通过提供一个足够声压级的低通噪声和陡峭的谱斜率使谱成分变得不可分辨。在这种情况下,复合音的低频分量被完全掩蔽,不完整复合音的最低分量的频率开始于低通滤波器的截止频率附近。

到目前为止,对于频率成分是基频整数倍的谐波复合音已经讨论过了,它的分量频率间距等于基频。然而,一个谐波复合音的所有谱成分都可以移动一定距离,以产生一个非谐波复合音。在非谐波复合音中,移除较低的频率成分,有时会产生模糊不清的虚音高。图5-11给出了一个基频为300Hz的复合音的例子,使用一个中心频率为2kHz的倍频程滤波器对它进行改变。由于该滤波器的下限频率为1.4kHz,上限频率为2.8kHz,因此通带包含了频率为1500、1800、2100、2400和2700Hz的复合音的第5~9次谐波。在这种情况下,剩余复合音产生的音高对应于匹配纯音的频率290 Hz(图5-11中间的圆圈)。

5f17222e9088b487d95ba0fd58276e7c.png

图5-11非谐波的复合音。匹配频率是最低频率分量的函数。由5个纯音组成的复合音,频率成分间距为300Hz

如果将带通滤波后的谐波复合音的这5个频率成分向低频移动一个固定距离,如移动100Hz,那么最低分量的频率成分为1400Hz,下一个分量为1700Hz,接着是2000Hz等等。在这种情况下,各个分量的频率不再是基频300Hz的整数倍,整个复合音称为不完整的非谐波复合音,其音高对应于270Hz。因此,将所有频率成分向低频偏移100Hz,则匹配频率将减少20Hz。如图5-11所示,所有频率成分向高频偏移100Hz,对应的匹配频率为310Hz。向上移动150Hz时,最低频率分量为1650Hz。如图5-11中虚线所示,这种情况下的非谐波复合音的音高变得微弱和模糊,在260Hz和320Hz处都有可能出现音高匹配。如果滤波后的谐波复合音的频率成分谱线进一步向更高的频率移动,音高再次变得更加突出和不那么模糊。图5-11表明这种非谐波复合音的音高显示这样的锯齿形状:从频率最低的分量1400 Hz开始,音高首先随着频率成分的增加而增加,然后变得模糊,在最低分量是1650Hz的频率附近,跳跃到一个较低的值,随着频率成分的进一步向上移动,音高再次增加。

:翻译自Hugo Fastl,Eberhard Zwicker,Psychoacoustics:Facts and Models,Springer,2006 

f56724ed6d18b3eb40498902a638b427.png

扩展阅读

1.再版《从这里学NVH——噪声、振动、模态分析的入门与进阶》序言

2.《从这里学NVH——旋转机械NVH分析与TPA分析》序言

3.什么是倍频程?

4.什么是分贝dB?

5.声音的共振模态

6.Chapter5|5.1 纯音的音高

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值