搞定音频技术
框架
声音是如何保存成数字信号的
那如何通过麦克风来采集声音
使用麦克风的音频数字信号采集过程如图 所示:
首先,声波通过空气传播到麦克风的振膜。
然后,振膜随空气抖动的振幅大小产生相应的电学信号。我们把这种带有声学表征的电学信号叫做模拟信号(Analog Signal)。
最后,通过 A/DC(模数转换器)将模拟信号转换成数字信号(Digital Signal)。即通过 PCM(Pulse Code Modulation)脉冲编码调制对连续变化的模拟信号进行抽样、量化和编码转换成离散的数字信号。这样我们就实现了音频信号的采集,我们常说的 PCM 文件就是未经封装的音频原始文件或者叫做音频“裸数据”
采样位深
采样位深也就是每个采样点用多少 bit 来表示。
采样率
采样率就是 1 秒内采集到的采样点的个数,一般用赫兹 Hz 来表示。比如 1 秒有 48000个采样点那么采样率就是 48000Hz(48kHz)。
选用什么样的采样率是根据具体用途来决定的,只是为了听见人声、听懂对方在说什么,8kHz.在网络音视频会议场景需要平衡音质和传输带宽消耗,我们一般可以使用 16kHz 或者 32kHz 的采样率
通道数
通道数的物理含义其实就是同一时间采集或播放的音频信号的总数
存储空间 = 采样位深 × 采样率 × 通道数 × 时长
比特带宽 = 采样位深 × 采样率 × 通道数