目录
MPEG介绍
MPEG标准主要有以下五个,MPEG-1、MPEG-2、MPEG-4、MPEG-7及MPEG-21等。该专家组建于1988年,专门负责为CD建立视频和音频标准,而成员都是视频、音频及系统领域的技术专家。及后,他们成功将声音和影像的记录脱离了传统的模拟方式,建立了ISO/IEC11172压缩编码标准,并制定出MPEG-格式,令视听传播方面进入了数字化时代。因此,大家现在泛指的MPEG-X版本,就是由ISO (InternationalOrganization for Standardization) 所制定而发布的视频、音频、数据的压缩标准。
MPEG-1音频压缩编码
MPEG-1中采用了感知音频编码,Layer II的编码器编码框图如下,上方部分是子带编码部分,这也是编码的主线;下方的部分,是MPEG音频编码的亮点。
多相滤波器
数字音频信号通过一个多相滤波器组,变换成32个等宽频带子带,使得信号具有较高的时间分辨率,确保在短暂冲击信号的情况下,编码的声音信号具有足够高的质量。高时域分辨率和高频域分辨率是不可兼得的,需要做出权衡。滤波器组的输出是临界频带经过量化的系数样值。若一个子带覆盖多个临界频带,则选择具有最小NMR的临界频带来计算分配给子带的比特数。
心理声学模型
心理声学模型决定了各个子带中允许的最大量化噪声,小于它的量化噪声都会被掩蔽。若子带内的信号功率小于掩蔽阈值,则不进行编码;否则,确定要编码的系数所需的比特数,使量化引起的噪声低于掩蔽效应;使用FFT将音频样值变换到频域。这里Layer II采用1024点FFT(Layer I中采用512点),提高了频率分辨率,可以得到更准确的频谱特性;将得到的频率组成临界频带,由于乐音和非乐音(噪声)信号的掩蔽能力不同,因此在临界频带的谱值中,将两种信号分离:可将局部峰值视为乐音,然后将本临界频带内的剩余频谱组成一个代表噪声频率(无调成份)
量化编码
- 在调整到固定码率之前
先确定可用于样值编码的有效比特数;
这个数值取决于比例因子、比例因子选择信息、比特分配信息以及辅助数据所需比特数。
- 比特分配
对每个子带计算掩噪比MNR (dB) = 信噪比SNR - 信掩比SMR,然后找出其中具有最低MNR的子带,并给该子带多分配一些比特,然后重新计算MNR,继续分配,重复该步骤,直至没有比特可以分配。这样可以使得在满足比特率和掩蔽要求的前提下,使MNR最小;
- 计算比例因子
对各个子带每36个样点(Layer I为12个样点)进行一次比例因子的计算,先确定12个连续样值中的最大值,查Layer II、Lay