1、采样率(sample rate)
采样就是把模拟信号转化为数字信号的过程;
采样频率越高,音频质量越高,数据量也越大;
采样频率不低于音频信号最高频率的两倍,就可以还原原始的声音;
人耳能听到频率范围大约在20Hz~20kHz之间,所以为了保证声音不失真,采频率在40kHz以上;
一个通过一秒钟的采样点数,常见的44.1kHz,表示一秒钟的采样数据是44100个。
2、量化精度(位宽)
每个采样点,都需要一个数值表示,一般是4bit、8bit、16bit、32bit等;
位数越多,表示越精细,声音质量越好,数量也越大;
常见的位宽是:8bit和16bit。
3、声道数
声道数一般表示声音录制时的音源数或回放时相应的扬声器数量
常见的是单声道(Mono)和双声道(Stereo)
4、音频帧
我们常听说的有视频帧,每一帧就是一张图像,而音频帧并没有明确的概念;
一般约定2.5ms~60ms为单位的数据量为一帧音频。
假设某通道的音频信号采样频率为8kHz,位宽16bit,20ms一帧,双通道,则一帧音频数据大小为:
int size = 8000 * 16bit * 0.02s * 2 = 5120 bit = 640 byte
5、比特率(码率)
指一个音频流中每秒中通过的数据量
计算:采样率* 位宽 * 声道数,单位:bps
比如常见的码率有:128kbit/s、160kbit/s和320kbit/s