音频基础
1、音频的录制过程:
1.1 首先需要,音频的采集设备,比如microiphone,捕获声音信息(初始捕获的信息肯定是模拟信号)
1.2 采集完模拟信号之后就通过模数转换,将模拟信号转化为计算机可以识别的二进制文件
1.3 然后对这些二进制音频数据再进行渲染、过滤等。
1.4 经过上面处理后,由于音频数据还比较大,会通过压缩算法进行压缩,之后就会生成如MP3文件,这些音频数据就可以保存usb 硬盘等设备。
2、音频的回放过程
音频的回放过程基本就是录制过程的逆操作:
2.1 首先从存储设备中取出保存的音频文件,并根据录制过程中的编码方式进行解码
2.2 音频系统为这播放实例选取最匹配的音频回放设备(如耳机、喇叭、蓝牙)
2.3 选择了播放设备之后,数据经过音频系统设计的路径进行传输
2.4 音频数据会通过数模转换,将数字信号转换为模拟信号,由播放设备播放声音
3、音频采样
将声波信号通过模数转换为计算机可以保存的二进制文件,这一过程就是音频采样(audio sampling),采样的核心就是把连续的模拟信号转换成离散的数字信号。整个过程如下:
![在这里插入图片描述](https://img-blog.csdnimg.cn/20200831200621155.PNG#pic_center)
pcm 俗称“脉冲编码调制”,是将模拟信号转换为数字信号的一种经典方式,它的原理就是我们上图的过程,即对原始的模拟信号进行抽样、量化和编码。从而产生pcm流。
3.1 采样速率
在将连续的模拟信号离散成数字信号时,这里就要考虑采样频率了,如果采样频率较大,就会导致音频文件较大,如果采样频率较
小,就会导致音频失真。这边提供一个参考值,一般人耳所能辨识的声音范围是20~20kHz,所以一般都会采用 44.1kHz、48kHz、
或者96KHz作为采样速率。
3.2 采样深度
量化(quanitization)是将连续值近似为某个范围内有限多个离散值的处理过程。
4、声道和立体声
4.1 单声道
在音频采集的时候,使用单设备采集。在播放音频的时候即使使用多个扬声器,由于信号源是一样的,达不到很好的效果
4.1 立体声
大自然中的声音就是立体声,如鸟叫、人说话、汽车鸣笛等,为什么这些声音会是立体声,因为在声源传播的过程中会先后到达人的
双耳,这种细微的差别被大脑处理后就变成了立体声。那我们想要扬声器播放立体声,就要在采集声源音频的时候,在声源周围采用多
个采集设备不同角度采集,播放的时候才有身临其境的感觉。
5、音频格式文件
5.1 不压缩格式
也就是pcm数据未经过压缩处理的数据,在mac和windows的保存格式为wav和aiff。
5.2 无损压缩格式
这种压缩格式的前提是不破坏音频信息,即后期可以完整的还原出原始数据;同时它在一定程度上可以减小文件的体积,目前已有
多种实现,如 FLAC、APE、WV、m4a等
5.3 有损压缩
为了更有利于存储,又能满足一定的音质要求,就诞生了有损压缩,我们熟知的有MP3以及ITunes上的AAC。
6 总结
以上是从物理层面简单介绍了音频的基础知识,方便我们后面分析音频框架。