两组声音的一维数据如何比较相似度_关于声道分离度,你需要知道的

本文讲的主要是功放和耳放的声道分离度。

首先先简短介绍一下什么是声道分离度。放大器的声道分离度通常是描绘当一个声道输出信号时,另外的声道输出多少残余信号。例如,测试时当音源只播放左声道时,放大器左声道会输出信号,但是右声道也会有残余信号输出。此时,右声道输出的残余信号越大,则这个放大器的声道分离度越低。当然,声道分离度本身也有多种测试方法,这里举得只是一个典型例子。

而关于声道分离度你需要知道的最主要的问题有两点。

1. 关于人类听觉极限

音箱功放的声道分离度低时,左右声道会有一定的串扰,可能导致立体声效果受到影响。但是,一旦声道分离度高于一定的值时,人耳就很难察觉甚至已经无法察觉。而对于目前的放大器制作,通常,合格的声道分离度其实实现起来并不是什么难事。一般在做功放或者一些主从式的有源音箱时都会对声道分离度有定义。总之,以目前的行业水平,很多情况下声道分离度属于感知不强甚至无法感知的范畴。我过去的测评中很少去测试,原因之一在于我时间有限,优先测试重要参数,对于感知不强或者无法感知的数据测试通常没有时间精力去测试。(懒)

当然,关于声道分离度的一些作用我其实在一年多之前的文章中也有所提及。

2. 对于耳放而言或者说耳机系统声道分离度很微妙

如果从一开始就看我文章的朋友,或者对声音的重现、音箱与耳机回放声音的区别有较为深入理解的人应该明白。为了更深入的了解这个问题本身,我在此还是简单再重复一遍。我们常说的声场的宽度和人声/乐器声像的宽度在心理声学中通常统称为感知声源宽度(ASW)。对于声场的宽度,可以用直线a与直线b所成角度θ来表示。这本来是一个衡量音乐厅好坏的重要指标,最早被Floyd Toole博士引入家用HiFi领域。Floyd Toole博士和Sean Olive博士通过数十年的研究发现ASW与IACC(双耳听觉互相关函数)和LF(早期侧向声能比)有关。通常播放一首音乐来说IACC越小,θ越大,我们听到的声音越宽。LF越大,ASW也越宽。

20c7cbbf26b9578d7fea7763811c50a8.png

在此,我先解释音箱和耳机在还原声场宽度上的区别。

e7315432b88b63b89a3cbeead350aee3.png

上图是一个典型的录音室,录音室在这里完成录音和混音的工作。在这里我先以左声道为例。为了简化问题,在这里我们只讨论直达声所引起的IACC区别。那么录音师在录音室,我们可以把左声道的监听音箱抽象为下图。

fa1581be910340eb39aa87a460965206.png

我们不难发现,左声道的音箱所发出的声音不只传输到人的左耳,也会传输到右耳。因此左声道的音乐,传播到我们人耳时,左右耳具有一定的相似度,即相关系数较强,IACC较大,ASW较小。

2fe8d1a8f7ad15f512d0829765edc870.png

所以当我们用音箱听歌时,也会有相似的声场宽度,即我们听到声场的宽度,也就是最左侧乐器与最右侧乐器之间的夹角θ与录音师想要表达的音乐比较接近。

c5e20d91f19ea872ca22d417586f1298.png

而当我们使用耳机听歌时,左声道发出的声音指挥传达到左耳,不会传达到右耳,使得双耳能量相似度较低,双耳听到的声音相关系数较低,即IACC较低,ASW较高,θ角远大于实际值,声场过宽。

鬼斧神工119:耳机和音箱有什么区别?哪一种更好?​zhuanlan.zhihu.com
d188d1eefa2b39734628fd2099c6c12d.png
鬼斧神工119:科普:HiFi中的声场由哪些因素决定?该如何选购器材能获得更好的声场?​zhuanlan.zhihu.com

其实不难发现,耳机还原声场的缺陷之一就在于没有crosstalk。那么从某种角度上讲,反而是耳机系统拥有一定的crosstalk更有利于声场的还原。

而事实上,很多耳机虚拟声场算法都会有一定的左右声道混音算法。把一个声道的声音经过一定的处理之后混入另一个声道,提升耳机的声源定位和声场表现。

并且,我在一年多一年的飞利浦9500的调音指南中也简要的说明并搭建了类似算法的基础混音逻辑并且简单的调试了一下。

因为飞利浦这个耳机的整体音质还可以,所以打算进一步发挥它的潜能——让这个耳机也有个还说得过去的声场表现。

此处我用到的是大名鼎鼎的AudioMulch,因为苹果的音频管理更省心一些,所以此处用MacBook Pro 15寸2018版做演示。

49336afc2fb18a600a6a911f0e40be46.png

116bfb628ed7b79d4d4e26403d1828ff.png

d9a1b8faaba7eb0c089d1232fa0644ff.png

AudioMulch是一套交互的声音合成与音效处理软件,可以用来当作音效处理或当作一套完整的音乐编辑与执行系统。AudioMulch内含了许多的声音合成及处理模组,也可以当作VST插件的主机。并且适用于MacOS系统的软件。(Windows也是可以用的,只是和macOS的相比略有差别)

早在之前就曾经讲过耳机的声场相对于音箱而言存在三个先天缺陷:

  1. 耳机没有串扰(Crosstalk)
  2. 耳机没有反射声
  3. 耳机的入射角度与音箱不同

fb2db7c581089f4e373f48ded466a01e.png

其中,第三个问题可以通过频响曲线在一定程度上解决。但是前两个问题,在录音文件也就是音源不是人头录音的情况下,基本只能靠算法来解决。

这里试听曲目首先选择王靖雯的《天空》;中的影子,因为这首歌的image(声像)和声源定位比较明显,比较适合听声场和声像。

a5205bae538c28ebdbb2b4ae8b4b1bf8.png

4642aafdbbfdd7a0cdbf2959079b479c.png

关于crosstalk的调节。由于比较复杂的、集成度较高的VST插件往往是各个公司的专有模块,所以这里我只采用最基本的VST插件,一来是不会产生侵权问题,二来是基本的插件都是随应用自带的,如果你真的有时间精力折腾Audiomulch不需要再在网上绞尽脑汁去找各种特殊的插件。不过,我还是觉得macOS版Audiomulch自带的一些audiounit插件比较好用。。。怎么说呢,这个软件还是更适合苹果电脑。

d7c348ca42be5fb23836dce202df545f.png

Crosstalk本身可以看作把左声道的音源经过一定的延时和衰减处理,再加一个滤波器通过mixer作用到右声道。这个延时量,也就是单独声道到达人左右耳的时间差与音箱距离人的距离和入射角度有关,通常如果音箱距离人耳大约2.5m并以30度入射时,这个时间差大概在0.25ms。不过,值得注意的是,有的延时模块不是以毫秒为单位,而是采样点数。而衰减的强度和滤波函数则与人头的外形有关,因人而异。

b63ff3407d1a03f11eb5067ed42fe4c0.png

1eb793456089276897309d75dd10ee37.png

接下来则是要解决反射声的问题。

ed9a1c40a8eeea830cb3dd6cdfe13bbc.png

如上图所示,为了简化问题,我们只需要保留最重要的两个早起反射声即可,也就是每个声道分别从前方入射我们左右耳的一阶反射声。但是上图中的数据并不绝对。这些数值作用在耳机上时需要再针对耳机重新调节。而每个反射声的滤波函数依旧因人而异。

a7be7908aadf7eb8519567c294742a3e.png

最后就是关于混响时间,由于一般的听音房间都属于“小房间”的范畴,并且带有吸声材料,所以混响时间较短;之前所加的早期反射声已经有足够的延时和能量,我在加混响模块后总觉得听起来有些拖泥带水,所以我个人没有加混响模块。

当然啦,最后一步的EQ补偿还是要加进来的。

d338173bfff0530f41dc882c4083633b.png

i9 CPU占用5.5%,还行~~

4062abe1f080dceed8ce3d235f221fa2.png

以上就是一个简单的耳机模拟音箱系统的调音过程,经过这样的调音之后声场会变得合理很多,人声的声像也变得更窄更真实,但由于算法比较简单,依旧有一定的头中效应。当然,现在有很多更复杂的算法可以达到更好的效果,但就像我这段调音指南开头所讲的,这些算法往往都是各大公司的专利,一般玩家很难获得。

总的来说飞利浦9500这款耳机在这个价位还是非常不错的,整体没有太大缺点,可玩性也比较高。

鬼斧神工119:飞利浦S9500详细调音指南​zhuanlan.zhihu.com
846fb969e81f233c6d5f8f3204a4feff.png

。。。

当然,这里并不是说耳放的声道分离度越低反而越好,具体要理解这个问题,还是要搞清楚耳机回放时如何模拟音箱或者真实声源的回放的基础原理以及如何主观评价声场等基础问题。

最后,防止还是想不明白这个简单问题的一些人抬杠。

这是Crosstalk。

f589e10963dc9859f935c8ebbd9e2b84.png
在音乐制作时,混音师用监听音箱混响时,Crosstalk和Mix Logic是同时存在的。

2571be6704893f731cfa63de4ea84dd9.png
所以在Mix Logic保存的音乐,必须要对应的Crosstalk才能做到完美还原。

9d045cfbeea66dba4abbee30a12c694c.png

这是Mix logic。

d7c348ca42be5fb23836dce202df545f.png
图片仅为示意图

这是ORTF。

0f0d20d65732db7b42054947182bb386.png

在音乐制作时,混音师用监听音箱混响时,Crosstalk和Mix Logic是同时存在的,所以在Mix Logic保存的音乐,必须要对应的Crosstalk才能做到完美还原。简而言之,音箱或真实乐器的Crosstalk受到HRTF和房间同时作用。这也是绝大多数耳机虚拟环绕算法一直效果不太行的原因。

鬼斧神工119:详解感知声源宽度与舞台宽度​zhuanlan.zhihu.com
43c50ca52612145d7e96c8326a60ae45.png

写在最后。

其实关于声道分离度或者声场(空间印象)的一些问题。我个人认为除了没有深入了解一些基本的声学和心理声学相关知识以外。根源还是在于不论是一些消费者还是一些所谓的专业从业者,大多数人对如何进行主观评价没有明确认识,只听过声音而没有听过音乐。

鬼斧神工119:HiFi与影音设备的物理限制​zhuanlan.zhihu.com
1a86a885379f2891a3b6337788135f2b.png
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值