声音的三要素
- 音调:音频的快慢,频率越高音调越高
- 音色:谐波
- 音量:振动的幅度,幅度越大,音量越大
PCM和WAV
音频原始数据格式
- PCM:纯音频数据,没有任何音频格式
- WAV:存储原始数据或压缩数据,在PCM文件前加一个头,包含了一些基本信息
量化基本概念
- 采样大小:一个采样用多少bit存放。常用的是16bit,能够表述的数值的最大范围值。
- 采样率:采样频率 8k、16k、32k、44.1k、48k,
- 声道数:单声道(1)、双声道(2)、多声道(立体声)
- PCM音频流码流 = 采样大小 * 采样率 * 声道数
WAV Header
- Num Channels :声道数
- Sample Rate :采样率
- BitsPerSample :采样大小,2字节 = 16位(bit)
- ByteRate :采样率字节数,ByteRate = BitsPerSample/8 * Sample Rate * Num Channels