MPEG音频编码

MPEG音频编码利用多相滤波器组、心理声学模型和码率分配技术,结合人耳听觉特性进行高效压缩。心理声学模型包括临界频带、掩蔽值计算,通过计算噪声掩蔽阈值进行动态比特分配,适用于不同应用场景,如MP3音乐压缩。MPEG音频分为Layer Ⅰ、Ⅱ、Ⅲ,层3(MP3)编码复杂,适合互联网高质量声音传输。
摘要由CSDN通过智能技术生成

MPEG(Moving Picture Experts Group,动态图像专家组)是ISO(International Standardization Organization,国际标准化组织)与IEC(International Electrotechnical Commission,国际电工委员会)于1988年成立的专门针对运动图像和语音压缩制定国际标准的组织。

MPEG标准主要有以下五个,MPEG-1、MPEG-2、MPEG-4、MPEG-7及MPEG-21等。该专家组建于1988年,专门负责为CD建立视频音频标准,而成员都是为视频、音频及系统领域的技术专家。及后,他们成功将声音和影像的记录脱离了传统的模拟方式,建立了ISO/IEC11172压缩编码标准,并制定出MPEG-格式,令视听传播方面进入了数码化时代。因此,大家现时泛指的MPEG-X版本,就是由ISO (InternationalOrganization for Standardization) 所制定而发布的视频音频、数据的压缩标准。

MPEG标准的视频压缩编码技术主要利用了具有运动补偿帧间压缩编码技术以减小时间冗余度,利用DCT技术以减小图像的空间冗余度,利用熵编码则在信息表示方面减小了统计冗余度。这几种技术的综合运用,大大增强了压缩性能。

 感知音频编码

原理框架

         输入声音信号经过一个多相滤波器组,变换到多个子带。同时,经过“心理声学模型”计算以频率为自变量的噪声掩蔽阈值、量化和编码部分用信掩比SMR决定分配给子带信号的量化位数,使量化噪声<掩蔽阈值。最后通过数据帧包装将量化的子带样本和其他数据按照规定的帧格式组装成比特数据流。

        MPEG音频压缩编码框架主体分为两条线:

  • 红框部分:PCM码流经多相滤波器组变换为32个子带的频域信号。以1152个样本为单位,输入到滤波器组中进行32个子带的分解,即以32个样本为一个时间窗口,做36次自带分解,形成36个样本,形成以12个样本为单位的3个块,以此进行比例因子的提取和选择,通过频域分析线路的辅助,进行后续的量化等工作。
  • 蓝框部分:对PCM信号进行FFT,和比例因子共同输入到心理声学模型中,输出SMR并生成听阈曲线,再结合码率限制进行动态
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值