数据压缩实验之 MPEG音频编码

本文深入探讨了MPEG音频编码技术,包括感知音频编码的设计思想,如时-频分析的矛盾,以及心理声学模型的实现过程,特别是临界频带、掩蔽效应和两种声学模型的细节。通过对不同特性音频文件的分析,展示了数据帧的比特分配和比例因子计算,以实现高效压缩。
摘要由CSDN通过智能技术生成

1.理解感知音频编码的设计思想

在这里插入图片描述

1.1 两条线

第一条线(红框部分):PCM码流经多相滤波器组变换为32个子带的频域信号
第二条线(蓝框部分):对PCM信号进行FFT,由心理声学模型计算以频率为自变量的噪声掩蔽阈值,使量化噪声小于噪声掩蔽域值,同时通过信号掩蔽比SMR确定比例因子选择信息和动态比特分配,决定给子带分配多少量化比特数。最后通过装帧将量化后的子带的样本和边信息编码数据(比例因子选择信息、动态比特分配)以及辅助数据按照规定的帧格式组装成帧比特流输出。

那么为什么要分成两条线呢?那就是由于“时-频分析的矛盾”。

1.2 时-频分析的矛盾

频域的分辨率和时域的分辨率之间存在矛盾,时域上采样时间越短,保持高的时域分辨率,但此时频谱展宽频域分辨率必然下降,时频分析的矛盾是编码算法需要考虑解决的关键点。
感知音频编码系统的处理就是分成两条线,第一条线用以保证短暂冲击信号的质量;而第二条线则是FFT系统+心理声学模型,以牺牲统计上的同一性的条件换取人类感知上的同一性,在保证音频整体质量的条件下获得最大的压缩比,而其消除音频信号感知冗余的重要手段则是通过心理声学模型获得这一帧音频信号的掩蔽阈。

2.理解心理声学模型的实现过程

2.1 临界频带的概念

临界频带于19世纪40年代年被Harvey Fletcher提出。耳蜗是内耳中听觉的传感器官,临界频带指的是由于耳蜗构造产生的听觉滤波器的频率带宽。
具体来说,听觉系统中,耳蜗起着频谱分析的作用,基底膜上特定位置点是对某一特征频率(Characteristic Frequency, CF)的响应最大,当声波偏离CF时,该点的响应减少,因此基底膜上每一点可等效成具有特定中心频率(CF)的带通滤波器,整个听觉系统可等效成一系列具有连续CF的、相互交叠的带通滤波器,所以被称为“听觉滤波器”。临界频带就是听觉系统带通滤波功能的反映,听觉滤波器的带宽即为临界带宽。

2.2 掩蔽值计算的思路

2.2.1 什么是声音的“掩蔽效应”?

人耳能够在寂静的环境中分辨出轻微的声音,但是在嘈杂的环境里,这些轻微的声音就会被杂音所淹没。这种由于第一个声音的存在而使得第二个声音听阈提高的现象就称为掩蔽效应。第一个声音称为掩蔽声,第二个声音称为被掩蔽声,第二个声音听阈提高的数量称为掩蔽效应。
在这里插入图片描述

2.2.2 “掩蔽效应”和临界频带的关系

由于人耳的特殊结构,在同一个临界频带内信号容易发生掩蔽效应,即:主要信号容易被能量大并且频率接近的掩蔽信号所掩蔽。因此我们可以认为Bark域越近的信号越容易产生掩蔽效应。

Bark域:

研究者发现人耳结构大致会对24个频率点产生共振,根据这个结论Eberhard Zwicker在1961年针对人耳特殊结构提出:信号在频带上也呈现出24个临界频带,分别从1到24。这就是Bark域。

2.2.3 两种声学模型

2.2.3.1 心理声学模型 I

优缺点:

计算复杂度低
但对假设用户听不到的部分压缩太严重

计算流程:
1、将样本变换到频域

模型1:采用512 (Layer I) 或1024 (Layers II and III)样本窗口
◼ Layer I:每帧384个样本点,512个样本点足够覆盖
◼ Layer II 和Layer III:每帧1152个样本点,每帧两次计算,模型1选择两个信号掩蔽比(SMR)中较小的一个

2、确定声压级别
3、考虑安静时阈值
4、将音频信号分解成“乐音(tones)” 和“非乐音/噪声”部分:因为两种信号的掩蔽能力不同
5、音调和非音调掩蔽成分的消除
6、单个掩蔽阈值的计算:音调成分和非音调成分单个掩蔽阈值根据标准中给出的算法求得。
7、全局掩蔽阈值的计算
在这里插入图片描述
8、每个子带的掩蔽阈值
9、计算每个子带信号掩蔽比,并将SMR传递给编码单元

2.2.3.2 心理声学模型
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值