音频参数概念详解

【音频】

指人耳可以听到的声音频率在20HZ~20kHz之间的声波,称为音频。

【采样频率】

即取样频率, 指每秒钟取得声音样本的次数。采样频率越高,声音的质量也就越好,声音的还原也就越真实,但同时它占的资源比较多。由于人耳的分辨率很有限,太高的频率并不能分辨出来。

22050 的采样频率是常用的, 44100已是CD音质, 超过48000或96000的采样对人耳已经没有意义。这和电影的每秒 24 帧图片的道理差不多。

如果是双声道(stereo), 采样就是双份的, 文件也差不多要大一倍.

【采样位数】

即采样值或取样值(就是将采样样本幅度量化)。它是用来衡量声音波动变化的一个参数,也可以说是声卡的分辨率。它的数值越大,分辨率也就越高,所发出声音的能力越强。

每个采样数据记录的是振幅, 采样精度取决于采样位数的大小:

    1 字节(也就是8bit) 只能记录 256 个数, 也就是只能将振幅划分成 256 个等级;
    2 字节(也就是16bit) 可以细到 65536 个数, 这已是 CD 标准了;
    4 字节(也就是32bit) 能把振幅细分到 4294967296 个等级, 实在是没必要了.


有了采用率和采用位数,就知道原始数据流(PCM)每秒的大小:[采用率]*[采样位数] = 原始比特率


【通道数】

即声音的通道的数目。常有单声道和立体声之分,单声道的声音只能使用一个喇叭发声(有的也处理成两个喇叭输出同一个声道的声音),立体声可以使两个喇叭都发声(一般左右声道有分工) ,更能感受到空间效果,当然还有更多的通道数。


【比特率】

每秒的传输速率(位速, 也叫比特率)。如705.6kbps 或 705600bps, 其中的 b 是 bit, ps 是每秒的意思,表示每秒705600bit的容量。

不同的音频格式编码,对PCM都有一个压缩比,所以比特率一般等于原始比特率/音频压缩比。


【帧长】

帧长记录了一个声音单元字节为单位,其长度为样本长度和通道数的乘积。

【帧数】

每秒数据分为都少帧

帧长*帧数*8 = 比特率


因为如果以PCM(未经编码的音频数据)来说,它根本就不需要帧的概念,根据采样率和采样精度就可以播放了。比如采样率为44.1KHZ,采样精度为16位的音频,你可以算出bitrate(比特率)是44100*16kbps,每秒的音频数据是固定的44100*16/8 字节。


©️2020 CSDN 皮肤主题: 大白 设计师:CSDN官方博客 返回首页