一 MPEG音频编码
1 基本原理
基本思想:去掉音频信号中的冗余。其中,冗余主要来自:声音信号中本身存在的冗余;不被人耳感知的部分。
1.1 MPEG-1 Audio Layer2 编码器原理
该编码器主要采用了心理声学模型。
· 输入声音信号经过一个多相滤波器组,变换到多个子带。同时经过“心理声学模型”计算以频率为自变量的噪声掩蔽阈值。量化和编码部分用信掩比 SMR 决定分配给子带信号的量化位数,使量化噪声<掩蔽域值。最后通过数据帧包装将量化的子带样本和其它数据按照规定的帧格式组装成比特数据流。
· 通过子带分析滤波器组使信号具有高的时间分辨率,确保在短暂冲击信号情况下,编码的声音信号具有足够高的质量。
· 又可以使信号通过FFT运算具有高的频率分辨率,因为掩蔽阈值是从功率谱密度推出来的。
· 在低频子带中,为了保护音调和共振峰的结构,就要求用较小的量化阶、较多的量化级数,即分配较多的位数来表示样本值。而话音中的摩擦音和类似噪声的声音,通常出现在高频子带中,对它分配较少的位数。
1.2 听觉阈值
· 听觉系统中存在一个听觉阈值电平,低于这个电平的声音信号就听不到;
· 听觉阈值的大小随声音频率的改变而改变;
· 一个人是否听到声音取决于声音的频率,以及声音的幅度是否高于这种频率下的听觉阈值;
· 蓝线为听觉阈值,声强在蓝线以下的部分无法被听到;
1.3 频域掩蔽
· 听觉阈值电平是自适应的,会随听到的不同频率声音而发生变化。音调音的掩蔽阈的宽度随频率而变化,掩蔽曲线不对称,高频段一侧的曲线斜率缓