声音的三要素:
频率, 振幅, 波形
频率代表音阶的高低(女生的音阶高,男生偏低), 频率越高,波长就会越短.
振幅代表响度
波形代表音色
音频采样:
对模型信号进行采样,采样可以理解为在时间轴上对信号进行数字化
AD转换:
按比声音最高频率高2倍以上的频率对声音进行采样.
采样率:
声音频率为500次,采样1000次,采集顶峰或底峰数据;
前面提到高质量音频信号,其频率范围是20Hz-20KHz.所以采样频率一般是44.1KHzs
声音的编码:
按照一定格式记录采样和量化后的数据
音频编码的格式有很多种,而通常所说的音频裸数据指的是脉冲编码调制(PCM)数据.
如果想要描述一份PCM数据,需要从如下几个方向出发:
- 量化格式(sampleFormat)
- 采样率(sampleRate)
- 声道数(channel)
比特率:
以CD音质为例,量化格式为16bite,采样率为44100,声道数为2.这些信息描述CD音质.那么可以CD音质数据,比特率是多少?
44100 * 16 * 2 = 1378.125kbps
那么一分钟的,这类CD音质数据需要占用多少存储空间?
1378.125 * 60 / 8 / 1024 = 10.09MB
如果sampleFormat更加精确或者sampleRate更加密集,那么所占的存储空间就会越大,同时能够描述的声音细节就会更加精确