简介
Advanced Audio Coding(高级音频解码),是⼀种由MPEG-4标准定义的有损⾳频压缩格式,由Fraunhofer发展,Dolby, Sony和AT&T是主要的贡献者。
ADIF:Audio Data Interchange Format 音频数据交换格式。这种格式的特征是可以确定的找到这个音频数据的开始,不能在音频数据流中间开始的解码,即它的解码必须在明确定义的开始处进⾏。故这种格式常⽤在磁盘⽂件中。
ADTS:Audio Data Transport Stream。是AAC音频的传输流格式,AAC音频格式在MPEG-2(ISO-13318-7 2003)中有定义。AAC后来又被采用到MPEG-4标准中。这种格式的特征是它是⼀个有同步字的比特流,解码可以在这个流中任何位置开始,它的特征类似于mp3数据流格式。
ADTS可以在任意帧解码
,也就是说它每⼀帧都有头信息
。ADIF只有⼀个统⼀的头,所以必须得到所有的数据后解码。
目前⼀般编码后的和抽取出的都是ADTS格式的⾳频流。
格式
AAC的ADIF格式:
AAC的ADTS格式:
空白处表示前后帧
有的时候当你编码AAC裸流的时候,会遇到写出来的AAC⽂件并不能在PC和⼿机上播放,很⼤的可能就是AAC⽂件的每⼀帧⾥缺少了ADTS头信息⽂件的包装拼接。只需要加⼊头⽂件ADTS即可。⼀个AAC原始数据块⻓度是可变的,对原始帧加上ADTS头进⾏ADTS的封装,就形成了ADTS帧。
AAC⾳频⽂件的每⼀帧由ADTS Header
和AAC Audio Data
组成。
结构体如下:
每⼀帧的ADTS的头⽂件都包含了⾳频的采样率,声道,帧⻓度等信息,这样解码器才能解析读取。
⼀般情况下ADTS的头信息都是7个字节,分为2部分:
-
adts_fixed_header();
-
adts_variable_header();
其⼀为固定头信息,紧接着是可变头信息。固定头信息中的数据每⼀帧都相同,而可变头信息则在帧与帧之间可变。
adts_fixed_header
syncword:同步头 总是0xFFF, all bits must be 1,代表着⼀个ADTS帧的开始。
ID:MPEG标识符,0标识MPEG-4,1标识MPEG-2。
Layer:always: ‘00’
protection_absent:表示是否误码校验。Warning, set to 1 if there is no CRC and 0 if there is CRC。
profile:表示使⽤哪个级别的AAC,如01 Low Complexity(LC)— AAC LC,有些芯⽚只⽀持AAC LC 。
在MPEG-2 AAC中定义了3种:
在MPEG-4 AAC中定义了多种:
profile的值等于MPEG-4 Audio Object Type - 1
#define FF_PROFILE_AAC_MAIN 0
#define FF_PROFILE_AAC_LOW 1
#define FF_PROFILE_AAC_SSR 2
#define FF_PROFILE_AAC_LTP 3
#define FF_PROFILE_AAC_HE 4
#define FF_PROFILE_AAC_HE_V2 28
#define FF_PROFILE_AAC_LD 22
#define FF_PROFILE_AAC_ELD 38
#define FF_PROFILE_MPEG2_AAC_LOW 128
#define FF_PROFILE_MPEG2_AAC_HE 131
sampling_frequency_index:表示使⽤的采样率下标,通过这个下标在Sampling Frequencies[ ]数组中查找得知采样率的值。
channel_configuration: 表示声道数,⽐如2表示⽴体声双声道
0: Defined in AOT Specifc Config
1: 1 channel: front-center
2: 2 channels: front-left, front-right
3: 3 channels: front-center, front-left, front-right
4: 4 channels: front-center, front-left, front-right, back-center
5: 5 channels: front-center, front-left, front-right, back-left, back-
right
6: 6 channels: front-center, front-left, front-right, back-left, back-
right, LFE-channel
7: 8 channels: front-center, front-left, front-right, side-left, side-right,
back-left, back-right, LFE-channel
8-15: Reserved
adts_variable_header
copyright_identification_bit:固定为0
copyright_identification_bit:固定为0
frame_length : ⼀个ADTS帧的⻓度包括ADTS头和AAC原始流
frame length, this value must include 7 or 9 bytes of header length: aac_frame_length = (protection_absent == 1 ? 7 : 9) + size(AACFrame)
protection_absent=0时, header length=9bytes。
protection_absent=1时, header length=7bytes。
adts_buffer_fullness:0x7FF 说明是码率可变的码流。
number_of_raw_data_blocks_in_frame:表示ADTS帧中有number_of_raw_data_blocks_in_frame + 1个AAC原始帧。所以说number_of_raw_data_blocks_in_frame == 0 表示说ADTS帧中有⼀个AAC数据块。
帧长度计算方法:
unsigned int getFrameLength(unsigned char* str)
{
if ( !str ){
return 0;
}
unsigned int len = 0;
int f_bit = str[3];
int m_bit = str[4];
int b_bit = str[5];
len += (b_bit>>5);
len += (m_bit<<3);
len += ((f_bit&3)<<11);
return len;
}
示例
1111 1111 1111 0001 0100 1100 1000 0000 0110 1010 1011 1111 1111 1100
111111111111 0 00 1 01 0011 0 010 0 0
0 0 00011 0101 0101 11111111111 00
syncword:111111111111 表示ADTS帧的开始
id:0 mpeg标识,0表示MPEG-4
layer:00 总是00
protection_absent:1 表示不使用crc
profile:01 aac的级别 LC
sampling_frequency_index:0011 采样率的下标 3表示采样率为48000
channel_configuration:010 声道数 2表示双声道
frame_length:00011 0101 0101 帧长度 355
adts_buffer_fullness:11111111111 0x7ff表示码率是可变码流
number_of_raw_data_blocks_in_frame:00 0表示ADTS帧中有一个AAC数据块