采样频率:单位时间内的采样次数。采样频率越大,采样点之间的间隔就越小,数字化后得到的声音就越逼真,对应的数据量就越大。声卡一般提供11.025kHZ、22.05kHZ和44.1kHZ等不同的采样频率。
采样位数:记录每次采样值数值大小的位数。采样位数通常有8bit和16bit两种,采样位数越大,能记录声音的变化度就越细腻,相应的数据量就越大。
声道数:处理的声音是单声道还是立体声。单声道只有单数据流,立体声有左右两个声道的数据流。
Sample
是一个声道20ms的采样个数。
采样频率为44100hz sample个数为44100/1000*20 = 441*2
Frame
一个线性的PCM 双声道音频文件每个Frame有2个样本,一个左声道样本,和一个右声道样本。20ms的采样数据为一个frame。
采样频率为44100采样位数为16一个frame的大小为:441*2(sample)*2(声道)*16(采样位数)/8 = 441*8 Byte
Packet
是一个或多个 frame 的集合,一个 packet 包含多少个 frame,是由声音文件格式决定的。譬如 PCM 文件格式中一个 packet 包含 1 个frame。而 MP3 文件格式中一个 packet 包含 1152 个frames。
不经过压缩,原始裸数据的计算公式为:
数据量(字节/秒) = (采样率 * 采样位数 * 声道数) / 8
采样频率为44100,采样位数为16位,双声道一秒钟的数据量 = 44100*16*2 / 8 = 44100*4
通常每帧数据中有20ms的数据量,所以每帧数据量=44100*16*2/(8*50) = 441*8字节