目录
#️ 分贝(Decibel)
#️ 赫兹(Hertz)
在数字音频中,声音信号的可视化观测属性单位为响度(分贝)与频率(赫兹)。
分贝(Decibel)
分贝是量度两个相同单位之数量比例的计量单位,主要用于度量声音强度,常用dB表示。换句话说,在使用分贝时,表达的是对于两事物的比较,度量一个事物相对于另一个事物某一个量的比率。这个量即计量单位,可以是功率、场强或声压。
—————— ✨例子 ——————
例如枪声的响度是140dB,这表达的是子弹发射产生的声压之比,与其进行度量比较的是人类的听觉响度阈值(即门槛)0dB,相对于此,枪声的声压即为其的+140%。
————————————————
在数字音频处理中,理论上声音信号的量程为[-∞,0]dB,我们常用音量表(VU meter)来观察声音的响度,使用推子(Fader)将声音信号进行增加和减弱。

1️⃣音量表(VU meter)
声音信号在0dB时为满量程(Full scale),也称作DBFS(Decibel Full Scale) 或 LUFS(LU指响度)。在实际中,超出0dB(LU)的信号将会被削减(Clipping),削减为一种失真形式,该失真与摇滚乐中的失真并不相同,我们在做音频处理时应尽量避免出现该类失真,有关为何会出现削减现象会在下文解释。
2️⃣推子(Fader)
在表盘中指的是对声音信号的响度进行增加或减弱,当推子位于0dB时,表示保持原声音信号响度输出,当推子大于0dB时,表示对信号进行增益,反之减弱。
赫兹(Hertz)
赫兹,是国际单位制中的频率单位,它是每秒钟的周期性变动重复次数的计量,表示物体每秒钟震动多少次。一般人耳能听到的最低频率为20Hz。
名称 | 频率范围 | 覆盖范围 | 信息 | 特点 | 表达丰富时 | 表达欠缺时 |
---|---|---|---|---|---|---|
次低频 Sub Bass | 20~40 Hz | 次底鼓 钢琴极低音 | —— | 力量感 难以听到 | —— | —— |
低频 Bass | 40~250 Hz | 底鼓、贝斯 低音提琴 | —— | 力度基础 | 沉闷 | 虚弱 |
中低频 Lo Mid | 250~500 Hz | 钢琴主区八度 人声 | 大部分 声音信息 | 声音基础 | 浑浊 | 单薄 |
中频 Mid | 500~2k Hz | 大多数乐器 人声 | 最详细 细节信息 | 声音主区 | 听觉疲劳 | 失去主体 |
中高频 Upper Mid | 2k~4k Hz | 人声、乐器音色 打击乐音色 | 音色 信息 | 音色特点 | 杂乱 | 单调 |
感知域 Presence | 4k~6k Hz | —— | 清晰度 信息 | 场景感知 | 刺耳脆弱 | 遥远沉闷 |
空气域 Air | 6k~20k Hz | —— | 谐波 信息 | 空灵 | 空虚 | 暗沉 |
声音频谱(Sound Spectrum)
自然界中的声音在数字音频上的可视化是通过声音频谱来实现的,在声音频谱显示器中,水平轴方向表示的是频率(Hz),垂直轴方向表示响度(振幅)(dB)。声音由基频(Fundamental frequency)和谐波(Harmonic wave)构成。
1️⃣基频(Fundamental frequency)
基频是声音的基准频率,一般为最低频率下振幅最高的点位(区位)。
2️⃣谐波(Harmonic wave)
谐波是在基频之外的高频率中的震动,能够帮助我们分辨乐器的音色
对于同一音调,不同乐器进行弹奏,其声音频谱基频相同,谐波不同。
—————— ✨例子 ——————
下图为使用钢琴和大提琴进行弹奏的A2(110Hz)音调频谱。红色框区域为基频,蓝色框区域为谐波。将两者频谱进行合并比较,可以发现其基频相同,故都是弹奏同一音调,但谐波不同,因为乐器的音色表现不同。



————————————————
采样率(Sampling Rate)
采样频率,也称为采样速度或者采样率,定义了单位时间内从连续信号中提取并组成离散信号的采样个数,它用赫兹(Hz)来表示。采样频率的倒数是采样周期或者叫作采样时间,它是采样之间的时间间隔。通俗的讲采样频率是指计算机单位时间内能够采集多少个信号样本。
自然界中的声音信号为模拟信号,我们需要使用声卡将麦克风录制下来的模拟信号转换成数字信号,形成计算机可以识别的0和1数据。声卡中的模数转换器(ADC, Analog to Digital Converter)会以特定的时间或间隔对信号进行采样,这个间隔被称为采样率。一般家庭录音使用的采样率是44100Hz,即音频接口每秒对模拟信号进行44100次采样,然后将测量值样本转换为二进制数据并发送到计算机当中。播放计算机硬盘中存储的音频时,将二进制数据通过声卡进行数模转换,尽可能还原原始波形并输出。
采样位(Sampling Bit)
即采样值或取样值,用来衡量量化的参数,是指声卡数字信号的二进制位数。声卡的位客观地反映了对输入信号描述的准确程度。 声卡的主要的作用之一是录制与回放,在这个过程中采样的位数决定了采集的质量。
在采样时,如果采样位为4bit,则其振幅的取样值由四位二进制数字组成,即采样样本可表达为个可能值,意味着样本的幅度只能表示为1到16的比例,声音频谱波形的垂直方向单位(幅度)最大值为16。采样位越高,则信号处理的分辨率和保真率也就越高,所以我们往往需要更高的采样率(次数)或采样位(深度)。大多数家庭录音的采样位为16bit,专业录音室往往使用32bit的采样位,来保证准确地重塑原始的音频信号。
在数字音频处理中,我们应尽量避免信号幅度超过采样位取样值的最大值,当信号幅度超出最大值时,系统将无法表达这些数据,并默认以最大值进行返回,因此,波形在超过最大值时将会被截断,即削波(Clipping)。
在大多数音量表中,出现削波的部分会用红色或橙色来表示。
End
参考数据:
百度百科-分别;百度百科-赫兹;百度百科-采样;Presonus Studio One。