MPEG-1音频编解码

一、人耳听觉系统的感知特性

1.听觉阈值

在这里插入图片描述
人耳能察觉到的声音为20-20KHZ,对3-4KHZ的声音感觉最灵敏,在最小可听域下方的声音可不编码。

2.频域掩蔽效应

在这里插入图片描述
一个高强度纯音可以使该频率附近的最小可听阈曲线提升,掩蔽掉本来可以听见的声音,因此可以去除掩蔽阈值以下的信号分量,并忽略可能会被掩蔽的量化噪声。

3.临界频带

临界频带是指当某个纯音被以它为中心频率、且具有一定带宽的连续噪声所掩蔽时,如果该纯音刚好被听到时的功率等于这一频带内的噪声功率,这个带宽为临界频带宽度。通常认为从20Hz到16kHz有25个临界频带,单位为bark,1 Bark = 一个临界频带的宽。

4.人耳听觉系统

人类听觉系统大致等效于一个信号通过一组并联的不同中心频率的带通滤波器。在这里插入图片描述

5.时域掩蔽效应

除了频域掩蔽,时间上相邻的声音也会有掩蔽现象,即一个时域上强音对附近的其他弱音有掩蔽效应。分为超前掩蔽和滞后掩蔽。

超前掩蔽约为5-20ms,滞后掩蔽有20-200ms。
根据时域掩蔽,对同一子带的中相邻的三个比例因子,可以选择丢弃其中较小的因子以减少传输用的比特数。

二、MPEG1音频压缩编码

在这里插入图片描述
输入信号分为两条线:
第一路经过滤波器组变为32个子带信号(使信号具有高的时间分辨率,确保在短暂冲击信号情况下,编码的声音信号具有足够高的质量),形成块,进行比例因子提取,然后输入到量化器,最后形成帧比特流输出。

第二路直接进行FFT(使信号具有高的频率分辨率),经过心理声学模型后确定动态比特分配和比例因子选择信息,最后进行边信息编码,一起封装成帧比特流进行传输,从而接收端可以顺利解码。

1.多相滤波器组

将PCM样本变换到32个子带的频域信号,使信号具有高的时间分辨率,确保在短暂冲击信号情况下,编码的声音信号具有足够高的质量。

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值