1、什么是声音
声音是由物体振动产生的声波,可以通过介质传播(空气、液态、固态),被人耳所接收到。产生振动物体被称为声源
2、音频三要素
声音的三要素包括:音调、响度和音色
音调:声音的频率,物体振动的快慢,人耳所能感知到的声音频率大约在20Hz~20KHz之间;低于20Hz称为次声,大于20KHz称为超声。
响度:振动的幅度,也是声音的高低
音色:声音的波形。音色不同是因为它们的介质所产生的波形不同
3、音频处理过程
1、音频采集
首先从麦克风等音频设备中采集声音信号,将模拟信号转换为数字信号,比如PCM(pluse code modulation)数据
2、预处理
音频采集后可以进行预处理,包括降噪、增益控制、滤波等操作,以净化声音信号,提升音频质量。
3、特征提取
从声音中提取出各种特征,如频谱特征、时域特征等,便于后续的处理和分析
4、音频编解码
对声音进行编码,压缩为较小数据量,便于降低传输和存储成本,,音频编码格式主要有AAC、MP3等
5、音频处理算法
主要对音频信号进行增强、调节或者修饰等要求,比如有均衡器、混音器、压缩器等。
6、音频合成
将处理过后的音频合成到一起输出、可以是音乐、语音等