MPEG音频编码

eshii

于 2022-07-17 10:38:54 发布

阅读量206

点赞数

分类专栏：数据压缩文章标签：大数据数据结构图像处理 visualstudio c++

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_47005361/article/details/125828578

版权

目录

一、理解感知音频编码的设计思想

时-频分析的矛盾

二、MPEG心理声学模型

全局掩蔽阈值的计算

三、代码实现

一、理解感知音频编码的设计思想

1.PCM码流经多相滤波器组变换为32个子带的频域信号

2.对PCM信号进行FFT，由心理声学模型计算以频率为自变量的噪声掩蔽阈值，使量化噪声小于噪声掩蔽域值，同时通过信号掩蔽比SMR确定比例因子选择信息和动态比特分配，决定给子带分配多少量化比特数。最后通过装帧将量化后的子带的样本和边信息编码数据（比例因子选择信息、动态比特分配）以及辅助数据按照规定的帧格式组装成帧比特流输出。

时-频分析的矛盾

频域的分辨率和时域的分辨率之间存在矛盾，时域上采样时间越短，保持高的时域分辨率，但此时频谱展宽频域分辨率必然下降，时频分析的矛盾是编码算法需要考虑解决的关键点。
感知音频编码系统的处理就是分成两条线，第一条线用以保证短暂冲击信号的质量；而第二条线则是FFT系统+心理声学模型，以牺牲统计上的同一性的条件换取人类感知上的同一性，在保证音频整体质量的条件下获得最大的压缩比，而其消除音频信号感知冗余的重要手段则是通过心理声学模型获得这一帧音频信号的掩蔽阈。

二、MPEG心理声学模型

临界频带

临界频带是指当某个纯音被以它为中心频率、且具有一定带宽的连续噪声所掩蔽时，如果该纯音刚好被听到时的功率等于这一频带内的噪声功率，这个带宽为临界频带宽度。

全局掩蔽阈值的计算

三、代码实现

结构分析

1.输出某个数据帧所分配的比特数

	if (frameNum ==

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
MPEG音频编码

MPEG，感知音频编码，心理声学模型
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。