目录
一、理解感知音频编码的设计思想
1.PCM码流经多相滤波器组变换为32个子带的频域信号
2.对PCM信号进行FFT,由心理声学模型计算以频率为自变量的噪声掩蔽阈值,使量化噪声小于噪声掩蔽域值,同时通过信号掩蔽比SMR确定比例因子选择信息和动态比特分配,决定给子带分配多少量化比特数。最后通过装帧将量化后的子带的样本和边信息编码数据(比例因子选择信息、动态比特分配)以及辅助数据按照规定的帧格式组装成帧比特流输出。
时-频分析的矛盾
频域的分辨率和时域的分辨率之间存在矛盾,时域上采样时间越短,保持高的时域分辨率,但此时频谱展宽频域分辨率必然下降,时频分析的矛盾是编码算法需要考虑解决的关键点。
感知音频编码系统的处理就是分成两条线,第一条线用以保证短暂冲击信号的质量;而第二条线则是FFT系统+心理声学模型,以牺牲统计上的同一性的条件换取人类感知上的同一性,在保证音频整体质量的条件下获得最大的压缩比,而其消除音频信号感知冗余的重要手段则是通过心理声学模型获得这一帧音频信号的掩蔽阈。
二、MPEG心理声学模型
临界频带
临界频带是指当某个纯音被以它为中心频率、且具有一定带宽的连续噪声所掩蔽时,如果该纯音刚好被听到时的功率等于这一频带内的噪声功率,这个带宽为临界频带宽度。
全局掩蔽阈值的计算
三、代码实现
结构分析
1.输出某个数据帧所分配的比特数
if (frameNum ==