音频术语中常见的“采样频率”对录音效果有什么影响

曾经有一位WaveCN录音编辑处理器的用户写信过来问了我一个问题。他对一段文字内容产生了疑问,原文如下:

问:
看看以下这种说法正确吗?
“48kHz采样率有必要吗?在相同的情况下,低频信号的采样效果要远比高频信号的采样效果好许多,这是为什么呢?我们知道,采样率代表着每秒对原始信号采样的次数,常见的音频文件采样率多是44.1kHz,也就是说,如果针对长度都为1秒钟的频率分别为20Hz和20kHz的信号都进行40kHz的采样,那么频率为20Hz的信号的振动被采样的次数为40000/20=2000次,而频率为20kHz的信号的振动被采样的次数则为40000/20000=2次。很显然,在这种情况,低频信号的采样效果要远比高频信号的采样效果更为详细。

这样看起来不难得到这样一个结论:要更好地采集记录高频信号,就需要更高的采样率。所以有些人在抓取CD音轨的时候便采用了48kHz的采样率。其实这是不可取的,因为CD音轨只有44.1kHz的采样率,而在后期抓音轨的时候采用高于原CD的采样率,是无法提高音质的。较高的采样率只有在对模拟源信号处理时才有效果,对于已经形成数字信号的音频文件而言并无用途。想要获得更高的效果,就要获得更好的音源。显然这是很难达到的,所以为了解决这个问题,VBR等编码方式便应运而生。”

上文的“低频信号的采样效果要远比高频信号的采样效果好许多”,这种说法正确吗?为什么?

本人的回答是:

对于上面的文字,可以说,原文的作者对奈奎斯特采样原理是知其然不知其所以然。首先我们来介绍一下采样这个名词。采样就是指通过信号采集设备,模拟信号以特定的频率记录为数值的形式。这个定义中的频率就是采样频率。采样频率越高,在单位时间内所进行的采集次数(采样点)就越多,从而采集到的信号样本就越多。根据奈奎斯特采样原理,只要采样频率是回放频率的两倍便可精确还原该频率的声音。因此不存在低频信号在单位时间内采样点数多而导致播放效果好这种说法。或者说,低频信号多出来的采样点其实可以说都是多余的

或者有人会问,事实上,对于同一个低频信号,更高的采样频率确实是采到了更多的采样信号啊,难道那些信号都不发声么?

当然,那些信号都发声,但是,要注意到我们的播放设备以及人耳等等整个播放、收听环节的响应都不是瞬态的,即采样点之间的时间间隔即使没有信号,但实际上这个频率所形成的功率曲线是存在的,而多出来的采样信号会被包络在两个基础的采样信号所形成的功率曲线中。参考下面两张图,这两张图都是用录音编辑处理器创建指定采样频率的空文件,然后使用简单频率生成器功能生成特定播放频率的音频信号,最后在比较专业的音频编辑软件CoolEdit Pro中打开,选择其中的0.1秒时间长度进行截图得到的:

低采样频率得到的采样信号分布图(100Hz音频,400Hz采样):

音频术语中常见的“采样频率”对录音效果有什么影响 - 加菲 - 视频会议 - 加菲
 

高采样频率得到的采样信号分布图(100Hz音频,800Hz采样):

音频术语中常见的“采样频率”对录音效果有什么影响 - 加菲 - 视频会议 - 加菲
 

从上面两图的对比可以清楚地发现,两幅图由于声音的频率相同,所以波形曲线都是相同的,而下面一幅图由于采样频率的不同而产生的更多的采样点对波形没有任何影响

实际上,如果采样得到的信号不正确(在录音过程中,所有的设备都会产生误差,不存在没有误差的可能),多余的采样点便会由于偏离了功率曲线而实际形成了其它频率信号,反而还影响了采样的效果

需要注意的是,现实世界中是不存在没有误差的播放设备的。误差存在于整个播放环节,包括AC97采样频率转换误差(这个是最大的误差)、输出功率放大器的误差(造成谐波)、喇叭的播放误差(引入失真度)等等,一个频率的声音在不同的采样率下的采样结果在播放时可能会被听到是不同的声音。

所以,要想播放效果好,应该从提高采样精度入手,比如说16位(bit)的采样精度位数就远远好过8位的采样精度位数,因为位数越多,精度就越高,就越准确。所以专业音频都使用24bit甚至32bit或者干脆用实数(-1≤x≤1)。

话又说回来,该段文字有意义的地方在于指出对数字信号进行再采样使用高于原采样频率的频率是无意义的这一点。因为即使采用再高的采样频率,也因为受原采样频率限制而导致超出的区域(44.1kHz-48kHz,即播放的22.05kHz~24kHz)根本没有数据而显得毫无意义。正确的地方还包括“较高的采样率只有在对模拟源信号处理时才有效果”。

但是,该段文字还存在其他错误:

1、抓CD音轨是将CD上记录的内容以数据方式直接读取,并不涉及到录音/播放等数模转换环节,因此根本就不存在使用采样频率。除非是通过录音软件从CD输入那里录音,才有采样频率的提法。

2、用采样频率来解释VBR模式牵扯太远,几乎可以说是不是直接相关。VBR方式目的是为了在节省存储空间(或称减少编码流数据)的前提下出现的,道理是一首歌中某些音频段落(A)由于受人耳的遮蔽效应影响比较严重导致较多的频率组成可以被忽略掉,因此可以用少一些数据来表现;而另一些段落(B)可能受该效应的影响比较少而需要较多的编码来表现。因此便产生VBR方式。在这里,并不能简单地认为由于低频信号可以用比较少的采样点来表达就可以把主要是低频内容的音频段落认为是A。换句话说,起作用的是遮蔽效应而不是数字信号的表达形式。因此,我们平时做音频压缩编码时的那个比特率bitrate是与具体的音频属性(采样频率,采样位数)无关的。

总结一句是,要熟练掌握音频技术,需要大量的基础知识。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值