数据压缩实验：MPEG音频编码

最新推荐文章于 2024-07-01 14:01:45 发布

凌忆寒

最新推荐文章于 2024-07-01 14:01:45 发布

阅读量212

点赞数

分类专栏：数据压缩文章标签：大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/CM1487230062/article/details/125673462

版权

一、实验原理

1、感知音频编码的设计思想

基本思想：声音压缩算法可以确立这种特性的模型来取消更多的冗余数据，分析信号，去掉不能被感知的部分。

2、心理声学模型的实现过程

生理 (Physiological ) 感知极限（传感极限）和心理 (Psychological ) 感知极限（信号处理极限）。

听觉系统中存在一个听觉阈值电平，低于这个电平的声音信号就听不到：

听觉阈值的大小随声音频率的改变而改变。

一个人是否听到声音取决于声音的频率，以及声音的幅度是否高于这种频率下的听觉阈值。

听觉掩蔽特性。即 听觉阈值电平是自适应的，会随听到的不同频率声音而发生变化。

1)、等响度曲线

-两个声音响度级相同，但强度不一定相同，还与频率有关；
-声压级越高，等响度曲线趋于平坦；
-人耳对3~4KHz的声音感觉最灵敏。

2）、频域掩蔽域随声压级变化曲线

-不对称，高频一端的斜率绝对值更小；
-低频音易对高频音产生掩蔽；
-掩蔽声强度越高、频率越高，掩蔽的频率范围越宽。

3)、理解心理声学模型的实现方法

临界频带(Critical Band)：

临界频带是指当某个纯音被以它为中心频率、且具有一定带宽的连续噪声所掩蔽时，如果该纯音刚好被听到时的功率等于这一频带内的噪声功率，这个带宽为临界频带宽度。

使噪声的中心频率等于信号频率，只改变噪声的带宽同时保持噪声的功率谱密度不变，测试纯音听阈随掩蔽噪声带宽变化的特性。
纯音的听阈随掩蔽噪声带宽的增大而增大，在带宽增大到某一特定值之后听阈保持恒定不变。

通常认为从 20Hz 到 16kHz 有 25 个临界频带，单位为 bark ， 1Bark = 一个临界频带的宽度

掩蔽效果的加和：
Lutfi 对多个掩蔽音同时存在时的综合掩蔽效果进行了研究：每个掩蔽音的掩蔽效果先独立变换然后再线性相加。

多相滤波器组：
用来分割子带。

人耳听觉系统：
人类听觉系统大致等效于一个信号通过一组并联的不同中心频率的带通滤波器，在0 Hz—20 kHz范围内的25个重叠的带通滤波器组。
听音者在噪声中听某一纯音信号时，只启用中心频率与信号频率相同的那个听觉滤波器，纯音信号通过该滤波器，而噪声信号只有通带范围内的部分信号能通过，通带以外的频率成分则被抑制，只有通过该滤波器的噪声才对掩蔽起作用。
聆听复音时启动多个听觉滤波器。听觉能够计算各滤波器输出端的信噪比。当信噪比达到或者超过听阈因子时，即可听到该频率成分。

4）MPEG-I 心理声学

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
数据压缩实验：MPEG音频编码

利用C++语言实现MPEG音频编码。
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。