数据压缩实验:MPEG音频编码

一、实验原理

1、感知音频编码的设计思想

基本思想:声音压缩算法可以确立这种特性的模型来取消更多的冗余数据,分析信号,去掉不能被感知的部分

2、心理声学模型的实现过程

生理 (Physiological ) 感知极限(传感极限) 心理 (Psychological ) 感知极限 (信号处理极限)
听觉系统中存在一个听觉阈值电平,低于这个电平的声音信号就听不到:
        听觉阈值的大小随声音频率的改变而改变。
        一个人是否听到声音取决于声音的频率,以及声音的幅度是否高于这种频率下的听觉阈值。
听觉掩蔽特性。即 听觉阈值电平是自适应的,会随听到的不同频率声音而发生变化。
1)、等响度曲线

        -两个声音响度级相同,但强度不一定相同,还与频率有关;
        -声压级越高,等响度曲线趋于平坦;
        -人耳对3~4KHz的声音感觉最灵敏。

2)、频域掩蔽域随声压级变化曲线

        -不对称,高频一端的斜率绝对值更小;
        -低频音易对高频音产生掩蔽;
        -掩蔽声强度越高、频率越高,掩蔽的频率范围越宽。 

3)、理解心理声学模型的实现方法

临界频带(Critical Band):
临界频带是指当某个纯音被以它为中心频率、且具有一定带 宽的连续噪声所掩蔽时,如果该纯音刚好被听到时的功率等 于这一频带内的噪声功率,这个带宽为临界频带宽度。
使噪声的中心频率等于信号频率,只改变噪声的带宽同时保持噪声的功率谱密度不变,测试纯音听阈随掩蔽噪声带宽变化的特性。
纯音的听阈随掩蔽噪声带宽的增大而增大,在带宽增大到某一特定值之后听阈保持恒定不变。
通常认为从 20Hz 16kHz 25 个临界频带,单位为 bark 1Bark = 一个临界频带的宽度

掩蔽效果的加和:
Lutfi 对多个掩蔽音同时存在时的综合掩蔽效果进行了研究: 每个掩蔽音的掩蔽效果先独立变换然后再线性相加。

 多相滤波器组:
用来分割子带。

 人耳听觉系统:
人类听觉系统大致等效于一个信号通过一组并联的不同中心频率的带通滤波器,在0 Hz—20 kHz范围内的25个重叠的带通滤波器组。
听音者在噪声中听某一纯音信号时,只启用中心频率与信号频率相同 的那个听觉滤波器,纯音信号通过该滤波器,而噪声信号只有通带范 围内的部分信号能通过,通带以外的频率成分则被抑制,只有通过该滤波器的噪声才对掩蔽起作用。
聆听复音时启动多个听觉滤波器。听觉能够计算各滤波器输出端的信噪比。当信噪比达到或者超过听阈因子时,即可听到该频率成分。

4)MPEG-I 心理声学

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值