AAC(Advanced Audio Coding)是一种高级音频编码,也是我们平常用的和见的最多了一种音频编码标准(音频编码标准,暂时看到的有:AAC、AC-3(DolbyDigital AC-3,d杜比数字AC-3是杜比公司开发的一种家庭影院多声道数字音频系统)、MP3(Moving Picture Experts Group Audio Layer-3)、WMA(Window Media Audio)),而AAC音频编码是一种有MPEG-4标准定义的有损音频压缩格式,同时它有两种音频文件格式:
- ADIF:音频数据交换格式(Audio Data Interchange Format),它的特征是可以确定的找到这个音频数据的开始,不需要进行在音频数据流中间开始解码,也就是说它的解码必须在明确定义的开始处开始进行。比较常用在磁盘文件中
- ADTS:音频数据传输流(Audio Data Transport Stream),它的特征与音频数据交换格式不同,它是一个有同步字的比特流,解码的时候,可以在这个音频流中任何位置开始进行解码。换一句话来说,ADTS可以在在任意帧解码(也就是说它每一帧都有头部信息);而ADIF只有一个统一的头,所以必须得到所有的数据后解码
下面来看一下这两种格式构造图:
ADIF组成
ADTS组成
注意:ADTS组成中,最前面的空格和最后的空格表示前后帧。不过目前编码后和抽取出来的都是ADTS格式的音频流
平时如果你遇到了编码AAC裸流的时候,很有可能会出现写出来的AAC文件不能在PC端和手机上进行正常播放,这时候可能的原因是你的AAC文件中的每一帧里面缺少了ADTS头信息文件的包装拼接。解决方法:只需要加⼊头⽂件ADTS即可。⼀个AAC原始数据块⻓度是可变的,对原始帧加 上ADTS头进⾏ADTS的封装,就形成了ADTS帧。
同时我们要知道AAC音频文件中的每一帧是由ADTS Header 和 AAC Audio Data组成,结构图如下:
AAC音频文件中的每一帧组成图
注意:ADTS Header的长度可能是7个字节或者9个字节,protection_absent=0时,则ADTS Header的长度为9个字节;如果protection_absent=1时,则ADTS Header的长度为7个字节
每⼀帧的ADTS的头⽂件都包含了⾳频的采样率,声道,帧⻓度等信息,这样解 码器才能解析读取。⼀般情况下ADTS的头信息都是7个字节,分为2部分:
- adts_fixed_header();
- adts_variable_header();
adts_fixed_header()为固定头信息,adts_variable_header()为可变头信息;固定头信息中的数据每⼀帧都相 同,⽽可变头信息则在帧与帧之间可变。
我们先来看固定头信息:
固定头信息
我现在来分析一下:
- syncword:同步头 总是0xFFF, all bits must be 1,代表着⼀个ADTS帧的开始
- ID:MPEG标识符,0标识MPEG-4,1标识MPEG-2
- Layer:always: '00'
- protection_absent:表示是否误码校验。Warning, set to 1 if there is no CRC and 0 if there is CRC
- profile:表示使⽤哪个级别的AAC,如01 Low Complexity(LC)--- AAC LC。有些芯⽚只⽀持AAC LC;在MPEG-2 AAC中定义了3种:
AAC等级
并且profile的值等于 Audio Object Type的值减1 profile = MPEG-4 Audio Object Type - 1
在ffmpeg源码中我们可以找到AAC级别被设成的值,就不用上面的那个公式来计算了:
/**
* profile
* - encoding: Set by user.
* - decoding: Set by libavcodec.
*/
int profile;
#define FF_PROFILE_UNKNOWN -99
#define FF_PROFILE_RESERVED -100
#define FF_PROFILE_AAC_MAIN 0
#define FF_PROFILE_AAC_LOW 1
#define FF_PROFILE_AAC_SSR 2
#define FF_PROFILE_AAC_LTP 3
#define FF_PROFILE_AAC_HE 4
#define FF_PROFILE_AAC_HE_V2 28
#define FF_PROFILE_AAC_LD 22
#define FF_PROFILE_AAC_ELD 38
#define FF_PROFILE_MPEG2_AAC_LOW 128
#define FF_PROFILE_MPEG2_AAC_HE 131
- sampling_frequency_index:表示使⽤的采样率下标,通过这个下标在 Sampling Frequencies[ ]数组中查找得知采样率的值。
采样率汇总
- channel_configuration: 表示声道数,⽐如2表示⽴体声双声道
0: Defined in AOT Specifc Config
1: 1 channel: front-center
2: 2 channels: front-left, front-right
3: 3 channels: front-center, front-left, front-right
4: 4 channels: front-center, front-left, front-right, back-center
5: 5 channels: front-center, front-left, front-right, back-left, back- right
6: 6 channels: front-center, front-left, front-right, back-left, back- right, LFE-channel
7: 8 channels: front-center, front-left, front-right, side-left, side-right, back-left, back-right, LFE-channel
8-15: Reserved
然后我开始来看可变头信息:
可变头信息
具体解析:
- frame_length : ⼀个ADTS帧的⻓度包括ADTS头和AAC原始流. frame length, this value must include 7 or 9 bytes of header length: aac_frame_length = (protection_absent == 1 ? 7 : 9) + size(AACFrame)
protection_absent=0时, header length=9bytes
protection_absent=1时, header length=7bytes
- adts_buffer_fullness:0x7FF 说明是码率可变的码流。number_of_raw_data_blocks_in_frame:表示ADTS帧中有 number_of_raw_data_blocks_in_frame + 1个AAC原始帧。所以说number_of_raw_data_blocks_in_frame == 0 表示说ADTS帧中有⼀个 AAC数据块
靠谱推荐:Free Pos,微信JOCIHEZ