音视频学习(十二、AAC格式介绍)

每次都普及这些基础的时候,都是要转载别人的文章,因为我也不熟,也是一边学习一边记录学习的过程,这些基础知识都是需要补的。

转载链接:AAC ADTS格式分析

12.1 AAC基本介绍

AAC音频格式:Advanced Audio Coding(高级音频解码),是一种由MPEG—4标准定义的有损音频压缩格式,由Fraunhofer发展,Dolby,Sony和AT&T是主要贡献者。

AAC音频格式有ADIF和ADTS:
ADIF:Audio Data Interchange format音频数据交换格式。这种格式的特征是可以确定的找到这个音频数据的开始,不需要进行在音频数据流中间开始解码,即它的解码必须在明确定义的开始处进行。故这种格式常用在磁盘文件中。

ADTS:Audio Data Transport Stream 音频数据传输流。这种格式的特征是它是一个有同步字的比特流,解码可以在这个流中任何位置开始。它的特征类似于mp3数据流格式。

简单说:ADTS可以在任意帧解码,也就是说它每一帧都有头信息。ADIF只有一个统一的头,所以必须得到所有的数据后解码。且这两种的header的格式也是不同的,目前一般编码后和抽取出来的都是ADTS格式的音频流。

在这里插入图片描述

有的时候当你编码AAC裸流的时候,会遇到写出来的AAC文件并不能在PC和手机上播放,很大的可能就是AAC文件的每一帧里缺少了ADTS头信息文件的包装拼接。

只需要加入头文件ADTS即可。一个AAC原始数据块长度是可变的,对原始帧加上ADTS头进行ADTS的封装,就形成了ADTS帧。

12.2 ADTS介绍

AAC音频文件的每一帧由ADTS Header和AAC Audio Data组成。结构体如下:
在这里插入图片描述

每一帧的ADTS的头文件都包含了音频的采样率,声道,帧长度等信息,这样解码器才能解析读取。
一般情况下ADTS的头信息都是7个字节,分为2部分:

  1. adts_fixed_header();
  2. adts_variable_header();

其一为固定头信息,紧接着是可变头信息。固定头信息中的数据每一帧都相同,而可变头信息则在帧与帧之间可变。
在这里插入图片描述

syncword :同步头 总是0xFFF, all bits must be 1,代表着一个ADTS帧的开始

ID:MPEG标识符,0标识MPEG-4,1标识MPEG-2

Layer:always: ‘00’

protection_absent:表示是否误码校验。Warning, set to 1 if there is no CRC and 0 if there is CRC

profile:表示使用哪个级别的AAC,如01 Low Complexity(LC)— AAC LC。有些芯片只支持AAC LC 。

MPEG-2 AAC中定义了3种:
在这里插入图片描述
profile的值等于 Audio Object Type的值减1
profile = MPEG-4 Audio Object Type - 1
在这里插入图片描述

#define FF_PROFILE_AAC_MAIN 0
#define FF_PROFILE_AAC_LOW  1
#define FF_PROFILE_AAC_SSR  2
#define FF_PROFILE_AAC_LTP  3
#define FF_PROFILE_AAC_HE   4
#define FF_PROFILE_AAC_HE_V2 28
#define FF_PROFILE_AAC_LD   22
#define FF_PROFILE_AAC_ELD  38
#define FF_PROFILE_MPEG2_AAC_LOW 128
#define FF_PROFILE_MPEG2_AAC_HE  131

sampling_frequency_index:表示使用的采样率下标,通过这个下标在 Sampling Frequencies[ ]数组中查找得知采样率的值。
在这里插入图片描述

channel_configuration: 表示声道数,比如2表示立体声双声道
在这里插入图片描述

0: Defined in AOT Specifc Config
1: 1 channel: front-center
2: 2 channels: front-left, front-right
3: 3 channels: front-center, front-left, front-right
4: 4 channels: front-center, front-left, front-right, back-center
5: 5 channels: front-center, front-left, front-right, back-left, back-right
6: 6 channels: front-center, front-left, front-right, back-left, back-right, LFE-channel
7: 8 channels: front-center, front-left, front-right, side-left, side-right, back-left, back-right, LFE-channel
8-15: Reserved

接下来看下adts_variable_header();
在这里插入图片描述

frame_length : 一个ADTS帧的长度包括ADTS头和AAC原始流.
frame length, this value must include 7 or 9 bytes of header length:
aac_frame_length = (protection_absent == 1 ? 7 : 9) + size(AACFrame)
protection_absent=0时, header length=9bytes
protection_absent=1时, header length=7bytes

adts_buffer_fullness:0x7FF 说明是码率可变的码流。

number_of_raw_data_blocks_in_frame:表示ADTS帧中有number_of_raw_data_blocks_in_frame + 1个AAC原始帧。所以说number_of_raw_data_blocks_in_frame == 0 表示说ADTS帧中有一个AAC数据块。

12.2 AAC实例解析

下面是ADTS的AAC文件部分:
在这里插入图片描述
第一帧的帧头7个字节为:0xFF 0xF1 0x4C 0x40 0x20 0xFF 0xFC
分析各个关键数值:
111111111111 (syncword)
0 (ID: 0:MPEG-4)
00 (Layer: 总是00)
1 (protection_absent:表示是否误码校验)
01 (profile: 01:ACC LC)
0011 (sampling_frequency_index:采样频率)
0 (private_bit)
001 (channel_configuration:声道)
0 (original_copy)
0 (home)
0 (copyright_id_bit)
0 (copyright_id_start)
0000100000111 (帧长度)
11111111111 (adts_buffer_fullness:0x77表示可变码流)
00 (number_of_raw_data_blocks_in_frame )

计算帧长度:将二进制 0000100000111 转换成十进制为263。观察第一帧的长度确实为263个字节。

计算方法:(帧长度为13位,使用unsigned int来存储帧长数值)

unsigned int getFrameLength(unsigned char* str)
{
  if ( !str )
  {
    return 0;
  }

  unsigned int len = 0;
  int f_bit = str[3];
  int m_bit = str[4];
  int b_bit = str[5];
  len += (b_bit>>5);
  len += (m_bit<<3);
  len += ((f_bit&3)<<11);
  return len;
}

还是大神分析的比较详细,今天又学习到了,音视频学习后面的路还很长。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值