实验原理
MPEG简介
MPEG-1
MPEG组织制定的第一个视频和音频有损压缩标准,也是最早推出及应用在市场上的MPEG技术,其原来的主要目标是在CD光盘上记录影像,后来被广泛应用在VCD光盘。视频压缩算法于1990年定义完成。1992年底,MPEG-1正式被批准成为国际标准。其中的音讯压缩的第三级(MPEG-1 Layer 3)简称MP3,成为比较流行的音讯压缩格式。
MPEG-2
1994年发布,广播质量的视讯、音讯和传输协议。被用于无线数位电视-ATSC、DVB以及ISDB、数字卫星电视(例如DirecTV)、数字有线电视信号,以及DVD视频光盘技术中。AAC 的音频编码就出现在MPEG-2中。
MPEG-1声音的主要性能
MPEG音频压缩
MPEG-1 Audio LayerII编码器原理
两条线
时间的瞬时特性
频域分析
时-频分析的矛盾
在低频部分,LayerI/II的带宽明显大于临界带宽
解决方法:提高频域分辨率(更多子带),同时保证向后兼容
![](https://i-blog.csdnimg.cn/blog_migrate/dda479ddcb2bc91723aa31a63d17d38c.png)
![](https://i-blog.csdnimg.cn/blog_migrate/965ae3b01813aa6e0c0767fd999134ee.png)
![](https://i-blog.csdnimg.cn/blog_migrate/168bb768c8b7ec27ac58a7987db26bd8.png)
MPEG-I 心理声学模型
通过子带分析滤波器组使信号具有高的时间分辨率,确保在短暂冲击信号情况下,编码的声音信号具有足够高的质量。
又可以使信号通过FFT运算具有高的频率分辨率,因为掩蔽阈值是从功率谱密度推出来的。
在低频子带中,为了保护音调和共振峰的结构,就要求用较小的量化阶、较多的量化级数,即分配较多的位数来表示样本值。而话音中的摩擦音和类似噪声的声音,通常出现在高频子带中,对它分配较少的位数。
心理声学模型1
1、将样本变换到频域
32个等分的子带信号并不能精确地反映人耳的听觉特性。引入FFT补偿频率分辨率不足的问题。
·采用Hann加权和DFT
Hann加权减少频域中的边界效应
此变换不同于多相滤波器组,因为模型需要更精细的频率分辨率,而且计算掩蔽阈值也需要每个频率的幅值
·模型1:采用512 (Layer I) 或1024 (Layers II and III)样本窗口
Layer I:每帧384个样本点,512个样本点足够覆盖
Layer II 和Layer III:每帧1152个样本点,每帧两次计算,模型1选择两个信号掩蔽比(SMR)中较小的一个
2、确定声压级别