一、实验原理
1. MPEG-1 声音的主要性能
- 1.1 输入为PCM 信号,采样率为32,44.1或48kHz,输出为32kbps到384kbps。
- 1.2 三个独立的压缩层次
- Layer1:编码器最简单,384kbps(4:1,用于小型数字盒带DCC,Compact Cassette))
- Layer2 :编码器复杂程度中等,256kbps ~192kbps (6:1 ~8 :1,用于DAB 、CD-I 和VCD)
- Layer3 :编码器最为复杂,64kbps ,用于ISDN ,网络音频。
- 1.3 心理声学模型
- 听觉系统中存在一个听觉阈值电平,低于这个电平的声音信号就听不到。听觉阈值的大小随声音频率的改变而改变。一个人是否听到声音取决于声音的频率,以及声音的幅度是否高于这种频率下的听觉阈值
- 听觉掩蔽特性。即听觉阈值电平是自适应的,会随听到的不同频率声音而发生变化
声音压缩算法可以确立这种特性的模型来取消更多的冗余数据
人耳听觉系统
- 人类听觉系统大致等效于一个在0Hz 到20KHz 频率范围内由25 个重叠的带通滤波器组成的滤波器组。
- 人耳不能区分同一频带内同时发生的不同声音;
- 临界频带(critical band ):当某个纯音被以它为中心频率、且具有一定带宽的连续噪声所掩蔽时,如果该纯音刚好被听到时的功率等于这一频带内的噪声功率,这个带宽为临界频带宽度。
- 500Hz 以