AAC基本概况:
l AAC(Advance Audio Coding):
即高级音频编码,出现在1997年,基于MPEG-2的音频编码技术,当时被称为MPEG-2 AAC,因此把其作为MPEG-2(MP2)标准的延伸。是由Fraunhofer IIS、杜比实验室、AT&T、Sony等公司共同开发,目的是取代MP3格式,随着MPEG-4(MP4)标准在2000年的成型,则为AAC也叫M4A。
l 和AC3编码关系:
和AC3关系不大,AC3早于AAC,是由AAC的发起单位杜比实验室和日本先锋合作研制的新编码方式。AAC能输出AC-3的任何码率,胜过AC-3,压缩率更高,但技术上更加复杂。
l AAC背景和发展:
1997年制定了不兼容MPEG-1的音频标准MPEG-2 NBC即MPEG-2 AAC;
1999年AAC又增加了LTP和PNS工具,形成了MPEG-4 AAC V1;
2002年在MPEG-4 AAC v1增加了SBR和错误鲁棒性工具,形成了 HE-AAC;
2004年MPEG-4在HE-AAC引入了PS模块,提升降码率性能,形成了EAAC+;
对于1999年、2002年、2004年增加了SBR和PS等编码技术的统称为MPEG-4 AAC;
**备注:**上面这些SBR PS等缩写就是音频的编码算法代名词,网上比较多,感兴趣的可以进一步自行搜索。1. SBR技术即Spectral Band Replication(频段复制)音乐的主要频谱集中在低频段,高频段幅度很小,但很重要,决定了音质。如果对整个频段编码,若是为了保护高频就会造成低频段编码过细以致文件巨大;若是保存了低频的主要成分而失去高频成分就会丧失音质。SBR把频谱切割开来,低频单独编码保存主要成分,高频单独放大编码保存音质,“统筹兼顾”了,在减少文件大小的情况下还保存了音质,完美的化解这一矛盾。
\2. PS指“parametric stereo”(参数立体声)。原来的立体声文件文件大小是一个声道的两倍。但是两个声道的声音存在某种相似性,根据香农信息熵编码定理,相关性应该被去掉才能减小文件大小。所以PS技术存储了一个声道的全部信息,然后,花很少的字节用参数描述另一个声道和它不同的地方。
l AAC编码技术参数:
采样率范围:8KHz-96KHz 范围比较广,就是一秒在模拟信号上进行多少次采样;
码率:8kbps-576kbps,支持范围比较宽,在压缩比和质量上都能考虑到;
声道:最多支持48个主声道,16个低频声道,声音细节更丰富,音乐场景也用的多;
采样精度:就是一个采样点需要在计算机表示占用的字节数,一般用2字节16bit表示;
l AAC编码的主要规格:
根据不同的编码技术,AAC的编码分为九种规格,这和H264的编码规格大同小异。
\1. MPEG-2 AAC LC低复杂度规格(Low Complexity)编码方式比较简单,没有增益控制,但是提高了编码效率,在中等码率的编码效率和音质方面,都能找到平衡点。
\2. MPEG-2 AAC Main 主规格
\3. MPEG-2 AAC SSR 可变采样率规格(Scaleable Sample Rate)
\4. MPEG-4 AAC LC 低复杂度规格(Low Complexity)
\5. MPEG-4 AAC Main 主规格–包含了除增益控制之外的全部功能,音质最好
\6. MPEG-4 AAC SSR 可变采样率规格(Scaleable Sample Rate)
\7. MPEG-4 AAC LTP 长时期预测规格(Long Term Prediction)
\8. MPEG-4 AAC LD 低延迟预测规格(Low Delay)
\9. MPEG-4 AAC HE 高效率规格(High Efficency)–这种规格适合用于低码率编码,有Nero-ACC编码器支持,是一种成熟的商用编码器。
目前使用最多的就是LC和HE(适合降低码率),**流行的Nero AAC编码程序支持LC、HE、HEv2三种规格的,而且编码后的AAC音频,规格都显示LC。**其中HE就是在AAC(LC)编码技术上增加SBR技术,HEv2就是AAC(LC)上技术上不仅仅增加了SBR技术,同时也增加了PS技术。
所以一般的商业音频编码器只支持部分编码规格,这也是我们选择编码器的重要考虑因素之一,因为不同的编码规格支持的音频采样率,码率都不一样