文章目录
一、人耳听觉系统的感知特性
1.听觉阈值
人耳能察觉到的声音为20-20KHZ,对3-4KHZ的声音感觉最灵敏,在最小可听域下方的声音可不编码。
2.频域掩蔽效应
一个高强度纯音可以使该频率附近的最小可听阈曲线提升,掩蔽掉本来可以听见的声音,因此可以去除掩蔽阈值以下的信号分量,并忽略可能会被掩蔽的量化噪声。
3.临界频带
临界频带是指当某个纯音被以它为中心频率、且具有一定带宽的连续噪声所掩蔽时,如果该纯音刚好被听到时的功率等于这一频带内的噪声功率,这个带宽为临界频带宽度。通常认为从20Hz到16kHz有25个临界频带,单位为bark,1 Bark = 一个临界频带的宽。
4.人耳听觉系统
人类听觉系统大致等效于一个信号通过一组并联的不同中心频率的带通滤波器。
5.时域掩蔽效应
除了频域掩蔽,时间上相邻的声音也会有掩蔽现象,即一个时域上强音对附近的其他弱音有掩蔽效应。分为超前掩蔽和滞后掩蔽。
超前掩蔽约为5-20ms,滞后掩蔽有20-200ms。
根据时域掩蔽,对同一子带的中相邻的三个比例因子,可以选择丢弃其中较小的因子以减少传输用的比特数。
二、MPEG1音频压缩编码
输入信号分为两条线:
第一路经过滤波器组变为32个子带信号(使信号具有高的时间分辨率,确保在短暂冲击信号情况下,编码的声音信号具有足够高的质量),形成块,进行比例因子提取,然后输入到量化器,最后形成帧比特流输出。
第二路直接进行FFT(使信号具有高的频率分辨率),经过心理声学模型后确定动态比特分配和比例因子选择信息,最后进行边信息编码,一起封装成帧比特流进行传输,从而接收端可以顺利解码。
1.多相滤波器组
将PCM样本变换到32个子带的频域信号,使信号具有高的时间分辨率,确保在短暂冲击信号情况下,编码的声音信号具有足够高的质量。