实验6 MPEG音频编码实验

最新推荐文章于 2024-07-20 18:50:04 发布

abulaba

最新推荐文章于 2024-07-20 18:50:04 发布

阅读量196

点赞数

分类专栏：数据压缩作业文章标签：音视频

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/abulaba/article/details/125727668

版权

一、实验原理

MPEG-1 Audio LayerII编码器原理

输入声音信号经过一个多相滤波器组，变换到多个子带。同时经过“心理声学模型”计算以频率为自变量的噪声掩蔽阈值。量化和编码部分用信掩比 SMR 决定分配给子带信号的量化位数，使量化噪声＜掩蔽域值。最后通过数据帧包装将量化的子带样本和其它数据按照规定的帧格式组装成比特数据流。
两条线
时间的瞬时特性

频域分析

时-频分析的矛盾
在低频部分，LayerI/II的带宽明显大于临界带宽

解决方法：提高频域分辨率（更多子带），同时保证向后兼容

（ 1 ）多相滤波器组，用来分割子带

（ 2 ）量化和编码 – 比例因子的取值和编码

（3）数据帧包装

心理声学模型的实现过程
MPEG-I 标准定义了两个模型：

心理声学模型1: 计算复杂度低；但对假设用户听不到的部分压缩太严重
心理声学模型2 : 提供了适合Layer III编码的更多特征
实际实现的模型复杂度取决所需要的压缩因子。

心理声学模型I

实现：

1、将样本变换到频域
32个等分的子带信号并不能精确地反映人耳的听觉特性。引入FFT补偿频率分辨率不足的问题。
2、确定子带声压级别
3、考虑安静时阈值，即绝对阈值
在标准中有根据输入PCM信号的采样率编制的“频率、临界频带率和绝对阈值”表。
4、将音频信号分解成“乐音(tones)” 和“非乐音/噪声”部分

两种信号的掩蔽能力不同。根据音频频谱的局部功率最大值确定乐音成分局部峰值为乐音，然后将本临界频带内的剩余频谱合在一起，组成一个代表噪声频率（无调成份）
5、音调和非音调掩蔽成分的消除
利用标准中给出的绝对阈值消除被掩蔽成分；考虑在每个临界频带内，小于0.5Bark的距离中只保留最高功率的成分
6、单个掩蔽阈值的计算
音调成分和非音调成分单个掩蔽阈值根据标准中给出的算法求得。
7、全局掩蔽阈值的计算

还要考虑别的临界频带的影响。一个掩蔽信号会对其它频带上的信号产生掩蔽效应

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
实验6 MPEG音频编码实验

输入声音信号经过一个多相滤波器组，变换到多个子带。同时经过“心理声学模型”计算以频率为自变量的噪声掩蔽阈值。量化和编码部分用信掩比 SMR 决定分配给子带信号的量化位数，使量化噪声＜掩蔽域值。最后通过数据帧包装将量化的子带样本和其它数据按照规定的帧格式组装成比特数据流。两条线时间的瞬时特性频域分析时-频分析的矛盾在低频部分，LayerI/II的带宽明显大于临界带宽解决方法：提高频域分辨率（更多子带），同时保证向后兼容（ 1 ）多
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。