音视频开发13 FFmpeg 音频 --- 常用音频格式AAC，AAC编码器， AAC ADTS格式。

hunandede

已于 2024-07-09 00:25:57 修改

阅读量1.5k

点赞数 3

分类专栏： ffmpeg基础知识文章标签：音视频 ffmpeg aac

于 2024-05-30 09:30:38 首次发布

本文链接：https://blog.csdn.net/hunandede/article/details/139311863

版权

ffmpeg基础知识专栏收录该内容

55 篇文章

订阅专栏

前提

这一节，我们学习常用的音频的格式 AAC，

重点是2个：

1.掌握AAC （高级音频编码）的基本知识。

目的是：当我们在将PCM原始数据编码成AAC的时候，能够深入理解一些参数。

2.掌握 AAC的传输格式 ADTS 头部的信息。

目的是：当音频数据有问题的时候，如果是AAC的编码，在分析头部信息的时候能够根据头部信息判断问题是否出现在头部。

1.AAC （高级音频编码）的基本知识

（Advanced Audio Coding，译为：高级音频编码）

AAC被设计为MP3格式的后继产品，通常在相同的比特率下可以获得比MP3更高的声音质量，是iPhone、iPod、iPad、iTunes的标准音频格式。

AAC相较于MP3的改进包含：

更多的采样率选择：AAC 的采样率 8kHz ~ 96kHz，MP3为16kHz ~ 48kHz
更高的声道数上限：AAC 可以支持 48个声道数，而MP3在MPEG-1模式下为最多双声道，MPEG-2模式下为5.1声道

我们可以看到在使用ffmpeg 中自带的编码器 AAC中的字段-ch_layouts，表示的是该编码器支持的声道数有哪些，注意，ch_layouts 是一个数组。数组中的每一项都应该是一个AVCHannelLayout 。

在后续的测试中，发现这一项为nullptr，猜测是由于AAC支持的声道数多达48个，因此ffmpeg 自带的AAC直接就不给值，不然给一个48项的数组有点多。

    /**
     * Array of supported channel layouts, terminated with a zeroed layout.
     */
    ///const AVChannelLayout *ch_layouts;
    const AVChannelLayout *ch_layouts = avcodec->ch_layouts;

改进的压缩功能：以较小的文件大小提供更高的质量
改进的解码效率：需要较少的处理能力进行解码

1.1 AAC的规格（Profile）

AAC是一个庞大家族，为了适应不同场合的需要，它有很多种规格可供选择。下面列举其中的9种规格（Profile）：

MPEG-2 AAC LC：低复杂度规格（Low Complexity）
MPEG-2 AAC Main：主规格
MPEG-2 AAC SSR：可变采样率规格（Scaleable Sample Rate）
MPEG-4 AAC LC：低复杂度规格（Low Complexity）
- 现在的手机比较常见的MP4文件中的音频部分使用了该规格
MPEG-4 AAC Main：主规格
MPEG-4 AAC SSR：可变采样率规格（Scaleable Sample Rate）
MPEG-4 AAC LTP：长时期预测规格（Long Term Predicition）
MPEG-4 AAC LD：低延迟规格（Low Delay）
MPEG-4 AAC HE：高效率规格（High Efficiency）

最早是基于MPEG-2标准，称为：MPEG-2 AAC。后来MPEG-4标准在原来基础上增加了一些新技术，称为：MPEG-4 AAC。

1.2 详解上述规格中的LC和HE

虽然上面列举了9种规格，但我们目前只需要把注意力放在常用的LC和HE上。下图很好的展示了从LC到HE的发展历程。

下图中，PNS 是

1.2.1 LC

LC适合中等比特率，比如96kbps ~ 192kbps之间。

MPEG-4 AAC LC等价于：

MPEG-2 AAC LC + PNS

PNS（Perceptual Noise Substitution）译为：感知噪声替代。

PNS可以提高AAC的编码效率

1.2.2 HE

HE有v1和v2两个版本，适合低比特率：

v1：适合48kbps ~ 64kbps
v2：适合低于32kbps，可在低至32kbps的比特率下提供接近CD品质的声音

2 AAC 的编解码器：

常用的有两种，一种是 ffmpeg 自带的AAC，一种是第三方的 libfdk_aac

2.1 FFmpeg AAC

FFmpeg AAC

支持LC规格
FFmpeg官方内置的AAC编解码器，在libavcodec库中
- 编解码器名字叫做aac
- 在开发过程中通过这个名字找到编解码器

2.1.1 FFmpeg AAC 对输入的PCM数据的参数要求

FFmpeg内部AAC格式只支持AV_SAMPLE_FMT_FLTP格式的PCM

因此如果我们要将 AV_SAMPLE_FMT_S16 的 pcm 通过 ffmpeg自带的编码器变成AAC，则先要音频重采样变成 AV_SAMPLE_FMT_FLTP ，然后再使用 ffmpeg自带的编码器编码成AAC。

2.2 FDK AAC

Fraunhofer FDK AAC

支持LC/HE规格，也就是说，如果我们在代码中需要让编码出来的aac是HE规格的，就需要使用libfdk_aac
目前质量最高的AAC编解码器
可以集成到FFmpeg的libavcodec中
- 编解码器名字叫做libfdk_aac
- 在开发过程中通过这个名字找到编解码器，最后调用FDK AAC库的功能

在网上下载的编译版FFmpeg，通常都是没有集成libfdk_aac的。可以通过命令行查看FFmpeg目前集成的AAC编解码器。

# windows
ffmpeg -codecs | findstr aac
 
# mac
ffmpeg -codecs | grep aac

我这边的输出结果是：

DEAIL. aac                  AAC (Advanced Audio Coding) (decoders: aac aac_fixed )
D.AIL. aac_latm             AAC LATM (Advanced Audio Coding LATM syntax)

很显然，并没有包含libfdk_aac。

这里给出1个比较推荐的方案：自己手动编译FFmpeg源码，将libfdk_aac集成到FFmpeg中。

自己手动编译的话，想集成啥就集成啥
可以把你想要的东西都塞到FFmpeg中，不想要的就删掉
也就是根据自己的需要对FFmpeg进行裁剪

2.2.1 FDK AAC 对输入的PCM数据是有参数要求的，如果参数不对，就会出现以下错误：

[libfdk_aac @ 0x7fa3db033000] Unable to initialize the encoder: SBR library initialization error
Error initializing output stream 0:0 -- Error while opening encoder for output stream #0:0 - maybe incorrect parameters such as bit_rate, rate, width or height
Conversion failed!

要求：采样格式

必须是16位整数PCM。

要求：采样率

支持的采样率有（Hz）：

8000、11025、12000、16000、22050、24000、32000
44100、48000、64000、88200、96000

同理，如果我们要将 非AV_SAMPLE_FMT_S16 的PCM通过 FDK AAC编码成 aac文件。

也需要通过音频重采样，先变成 AV_SAMPLE_FMT_S16 的pcm，采样率也应该符合FDK-AAC的采样率。

3 使用ffmpeg命令完成 pcm 的编码 - 基于libfdk aac

基本使用

最简单的用法如下所示：

因为pcm只是原始数据，因此要告知输入的pcm 的参数

# pcm -> aac
ffmpeg -ar 44100 -ac 2 -f s16le -i in.pcm -c:a libfdk_aac out.aac
 
# wav -> aac
# 为了简化指令，本文后面会尽量使用in.wav取代in.pcm
ffmpeg -i in.wav -c:a libfdk_aac out.aac

-ar 44100 -ac 2 -f s16le
- PCM输入数据的参数
-c:a
- 设置音频编码器
- c表示codec（编解码器），a表示audio（音频）
- 等价写法
  - -codec:a
  - -acodec
- 需要注意的是：这个参数要写在aac文件那边，也就是属于输出参数

默认生成的aac文件是LC规格的。

ffprobe out.aac
 
# 输出结果如下所示
Audio: aac (LC), 44100 Hz, stereo, fltp, 120 kb/s

ffmpeg-aac 的常用参数

-b:a

Set bit rate in bits/s. Setting this automatically activates constant bit rate (CBR) mode. If this option is unspecified it is set to 128kbps.

a表示的是audio，这说明 bit rate 是音频和视频都可以使用的参数

以bits/s为单位设置比特率。
设置此选项会自动激活恒定比特率（CBR）模式。如果未指定此选项，则将其设置为128kbps。

这句话的意思是，这玩意有个默认值，是128kbps，如果设置了该值，则整个aac都是使用的 恒定比特率。

-q :a

Set quality for variable bit rate (VBR) mode. This option is valid only using the ffmpeg command-line tool. For library interface users, use global_quality.

设置可变比特率（VBR）模式的质量。此选项仅在使用ffmpeg命令行工具时有效。对于库接口用户，请使用global_quality。

profile

Sets the encoding profile, possible values:

‘aac_low’

The default, AAC "Low-complexity" profile. Is the most compatible and produces decent quality.

‘mpeg2_aac_low’

Equivalent to -profile:a aac_low -aac_pns 0. PNS was introduced with the MPEG4 specifications.

‘aac_ltp’

Long term prediction profile, is enabled by and will enable the aac_ltp option. Introduced in MPEG4.

‘aac_main’

Main-type prediction profile, is enabled by and will enable the aac_pred option. Introduced in MPEG2.

If this option is unspecified it is set to ‘aac_low’.

fdk-aac 可以使用的常用参数注意这里是fdk-aac的参数

-b:a
- 设置输出比特率
- 比如-b:a 96k

ffmpeg -i in.wav -c:a libfdk_aac -b:a 96k out.aac

-profile:a
- 设置输出规格
- 取值有：
  - aac_low：Low Complexity AAC (LC)，默认值
  - aac_he：High Efficiency AAC (HE-AAC)
  - aac_he_v2：High Efficiency AAC version 2 (HE-AACv2)
  - aac_ld：Low Delay AAC (LD)
  - aac_eld：Enhanced Low Delay AAC (ELD)
- 一旦设置了输出规格，会自动设置一个合适的输出比特率
  - 也可以用过-b:a自行设置输出比特率

ffmpeg -i in.wav -c:a libfdk_aac -profile:a aac_he_v2 -b:a 32k out.aac

-vbr
- 开启VBR模式（Variable Bit Rate，可变比特率）
- 如果开启了VBR模式，-b:a选项将会被忽略，但-profile:a选项仍然有效
- 取值范围是0 ~ 5
  - 0：默认值，关闭VBR模式，开启CBR模式（Constant Bit Rate，固定比特率）
  - 1：质量最低（但是音质仍旧很棒）
  - 5：质量最高

VBR	kbps/channel	AOTs
1	20-32	LC、HE、HEv2
2	32-40	LC、HE、HEv2
3	48-56	LC、HE、HEv2
4	64-72	LC
5	96-112	LC

AOT是Audio Object Type的简称。

2.AAC ADTS格式分析

AAC⾳频格式：Advanced Audio Coding(⾼级⾳频解码)，是⼀种由MPEG-4标准定义的有损⾳频压缩格式，由Fraunhofer发展，Dolby, Sony和AT&T是主要的贡献者。

AAC 的封装格式有两种 ADIF 和 ADTS

ADIF：已经基本弃用-ADIF只有⼀个统⼀的头，所以必须得到所有的数据后解码。

Audio Data Interchange Format ⾳频数据交换格式。这种格式的特征是可以确定的找到这个⾳频数据的开始，不需进⾏在⾳频数据流中间开始的解码，即它的解码必须在明确定义的开始处进⾏。故这种格式常⽤在磁盘⽂件中。

ADTS ADTS可以在任意帧解码，也就是说它每⼀帧都有头信息，这个是重点

Audio Data Transport Stream。是AAC⾳频的传输流格式。AAC⾳频格式在MPEG-2（ISO-13318-7 2003）中有定义。AAC后来⼜被采⽤到MPEG-4标准中。这种格式的特征是它是⼀个有同步字的⽐特流，解码可以在这个流中任何位置开始。它的特征类似于mp3数据流格式。

可能遇见的问题1：

有的时候当你编码AAC裸流的时候，会遇到写出来的AAC⽂件并不能在PC和⼿机上播放，很⼤的可能就是AAC⽂件的每⼀帧⾥缺少了ADTS头信息⽂件的包装拼接。

只需要加⼊头⽂件ADTS即可。⼀个AAC原始数据块⻓度是可变的，对原始帧加:上ADTS头进⾏ADTS的封装，就形成了ADTS帧。

3.ADTS 格式下 AAC⾳频⽂件格式

每⼀帧由ADTS Header和AAC Audio Data（在图中，是 AAC ES）组成。结构体如下：

也就是说，，一个AAC 帧，包含了一个ADTS header 和一堆具体的数据。另外AAC的一帧一般包含了1024个采样点。

头文件 ADTS Header 的组成

是由固定头信息 + 可变头信息。组成

固定头信息中的数据每⼀帧都相同，⽽可变头信息则在帧与帧之间可变

每⼀帧的ADTS的头⽂件都包含了⾳频的采样率，声道，帧⻓度等信息，这样解码器才能解析读取。

⼀般情况下ADTS的头信息都是7个字节，分为2部分：

adts_fixed_header();

adts_variable_header();

其⼀为固定头信息，紧接着是可变头信息。固定头信息中的数据每⼀帧都相同，⽽可变头信息则在帧与帧之间可变。

头文件固定部分：adts_fixed_header()

syncword ：同步头总是0xFFF, all bits must be 1，代表着⼀个ADTS帧的开始 12bits

ID： MPEG标识符，0标识MPEG-4，1标识MPEG-2 1bits

Layer： always: '00' 2 bits

protection_absent：表示是否误码校验。1代表 header 有 7个字节，0代表 header有9个字节，一般情况下都是7个字节。Warning, set to 1 if there is no CRC and 0 if there is CRC 1bits

profile：表示使⽤哪个级别的AAC，如01 Low Complexity(LC)--- AAC LC。有些芯⽚只⽀持AAC LC 。 2bits。。通过前面的ID，我们可以设置是 MPEG-4，还是 MPEG-2

在MPEG-2 中，有明确的指出 profile这个值是多少。且只有三种参见下表

在MPEG-4中，profile的计算要通过 MPEG-4 Audio Object Type - 1

profile = MPEG-4 Audio Object Type - 1

如下的MPEG-4中关于 aac audio Object Type的说明

对应的profile的值

sampling_frequency_index：表示使⽤的采样率下标，通过这个下标在 Sampling Frequencies[ ]数组中查找得知采样率的值。4bits

channel_configuration: 表示声道数，⽐如2表示⽴体声双声道 3bits，

MPEG-4 中规定的值如下：

0: Defined in AOT Specifc Config

1: 1 channel: front-center

2: 2 channels: front-left, front-right

3: 3 channels: front-center, front-left, front-right

4: 4 channels: front-center, front-left, front-right, back-center

5: 5 channels: front-center, front-left, front-right, back-left, back-right

6: 6 channels: front-center, front-left, front-right, back-left, back-right, LFE-channel

7: 8 channels: front-center, front-left, front-right, side-left, side-right,back-left, back-right, LFE-channel

8-15: Reserved

还有3个没有介绍：都占1bite，

private_bits:

original:

home:

头文件adts_variable_header()

copyright_identification_bits: 未知，占1bits

copyright_identification_start：未知，占1bits

aac_frame_length : ⼀个ADTS帧的⻓度包括ADTS头和AAC原始流. 单位是bytes

aac_frame_length = (protection_absent == 1 ? 7 : 9) + size(AACFrame) 13 bits

protection_absent=0时, header length=9bytes

protection_absent=1时, header length=7bytes

adts_buffer_fullness：0x7FF 说明是码率可变的码流。一般都是写的0x7FF这个值 11bits

number_of_raw_data_blocks_in_frame：

表示ADTS帧中有number_of_raw_data_blocks_in_frame + 1个AAC原始帧。

如果number_of_raw_data_blocks_in_frame 的值是0，表示说ADTS帧中有⼀个AAC原始帧。

如果 number_of_raw_data_blocks_in_frame 的值是1，表明ADTS帧中有2个原始帧。

例子：

下⾯是ADTS的AAC⽂件部分：⾼字节开始算

第⼀帧的帧头7个字节为：0xFF 0xF1 0x4C 0x40 0x20 0xFF 0xFC

我们将这7个字节拿出来，转化成2进制

0xFF 0xF1 0x4C 0x40 0x20 0xFF 0xFC

11111111 11110001 01001100 0100 0000 0010 0000 1111 1111 1111 1100

分析各个关键数值：

0xFF 0xF1 表示如下的部分

111111111111 syncword ：同步头总是0xFFF, all bits must be 1，代表着?个ADTS帧的开始 12bits

0 ID： MPEG标识符，0标识MPEG-4，1标识MPEG-2 1bits

00 Layer： always: '00' 2 bits

1 protection_absent：表示是否误码校验。1代表 header 有 7个字节，0代表 header有9个字节，一般情况下都是7个字节。Warning, set to 1 if there is no CRC and 0 if there is CRC 1bits

0x4C 全部， 0x40中的4 表示部分如下

01 profile：表示使?哪个级别的AAC，如01 Low Complexity(LC)--- AAC LC。有些芯片只支持AAC LC 。 2bits

0011 ，sampling_frequency_index ：通过这个下标在 Sampling Frequencies[ ]数组中找采样率的值 4bits

0 private_bits: 1 bits

001 channel_configuration: 表示声道数，比如2表示立体声双声道 3bits

0 original: 1bits

0 home: 1bits

0x40中的4 ，，， 0x20 0xFF 0xFC 全部表示如下

0 copyright_identification_bits: 未知，占1bits

0 copyright_identification_start：未知，占1bits

0000100000111(帧⻓度) aac_frame_length 占 13 bits

11111111111 adts_buffer_fullness：0x7FF 说明是码率可变的码流。 11bits

00 number_of_raw_data_blocks_in_frame：

表示ADTS帧中有number_of_raw_data_blocks_in_frame + 1个AAC原始帧。占2bits

一般一个

计算帧⻓度：将⼆进制 0000100000111 转换成⼗进制为263。观察第⼀帧的⻓度确实为263个字节。红色部分的为帧头部的固定部分 0xFF 0xF1 0x4C 0x40 0x20 0xFF 0xFC ，该帧长度所属位置为蓝色部分，其中第一个0的后两个0， 0000

得到帧长度的计算⽅法:（帧⻓度为13位，使⽤unsigned int来存储帧⻓数值）

unsigned int getFrameLength(unsigned char* str)
{
	 if ( !str )
	 {
	 return 0;
	 }
	 unsigned int len = 0;
	 int f_bit = str[3];
	 int m_bit = str[4];
	 int b_bit = str[5];
	 len += (b_bit>>5);
	 len += (m_bit<<3);
	 len += ((f_bit&3)<<11);
	 return len;
}

核心编码：注意的在生成 ADTS Header 的代码

    // 读取媒体文件，并把aac数据帧写入到本地文件，注意，从mp4文件中读取到的aac就只有 aac data 的部分，没有头的部分，头的部分我们需要自己添加，使用的方法为自定义的adts_header方法
//    av_read_frame方法的一些说明
//    对于音频，如果每个帧具有已知的固定大小（例如PCM或ADPCM数据），则它包含整数个帧。
    // 如果音频帧具有可变大小（例如MPEG音频），则它包含一个帧。
    //当前走到这里，读取的一定是AAC数据，那么av_read_frame读取到pkt中的一定是一帧的大小，因此adts_header方法中，传递的第二个参数就是一帧的大小。
    int ret1 =0;
    while((ret1 = av_read_frame(ifmt_ctx, &pkt)) >=0 )
    {
        if(pkt.stream_index == audio_index)
        {
            char adts_header_buf[7] = {0};//这里我们自己写的时候，头部占7bytes，意味着 校验位的值是1，表示不用校验
            adts_header(adts_header_buf, pkt.size,
                        ifmt_ctx->streams[audio_index]->codecpar->profile,
                        ifmt_ctx->streams[audio_index]->codecpar->sample_rate,
                        ifmt_ctx->streams[audio_index]->codecpar->channels);
            fwrite(adts_header_buf, 1, 7, aac_fd);  // 写adts header , ts流不适用，ts流分离出来的packet带了adts header
            len = fwrite( pkt.data, 1, pkt.size, aac_fd);   // 写adts data
            if(len != pkt.size)
            {
                av_log(NULL, AV_LOG_DEBUG, "warning, length of writed data isn't equal pkt.size(%d, %d)\n",
                       len,
                       pkt.size);
            }
        }
        av_packet_unref(&pkt);
    }

int adts_header(char * const p_adts_header, const int data_length,
                const int profile, const int samplerate,
                const int channels)
{

    int sampling_frequency_index = 3; // 默认使用48000hz
    int adtsLen = data_length + 7;

    int frequencies_size = sizeof(sampling_frequencies) / sizeof(sampling_frequencies[0]);
    int i = 0;
    for(i = 0; i < frequencies_size; i++)
    {
        if(sampling_frequencies[i] == samplerate)
        {
            sampling_frequency_index = i;
            break;
        }
    }
    if(i >= frequencies_size)
    {
        printf("unsupport samplerate:%d\n", samplerate);
        return -1;
    }

    p_adts_header[0] = 0xff;         //syncword:0xfff                          高8bits
    p_adts_header[1] = 0xf0;         //syncword:0xfff                          低4bits
    p_adts_header[1] |= (0 << 3);    //MPEG Version:0 for MPEG-4,1 for MPEG-2  1bit
    p_adts_header[1] |= (0 << 1);    //Layer:0                                 2bits
    p_adts_header[1] |= 1;           //protection absent:1                     1bit

    p_adts_header[2] = (profile)<<6;            //profile:profile               2bits
    p_adts_header[2] |= (sampling_frequency_index & 0x0f)<<2; //sampling frequency index:sampling_frequency_index  4bits
    p_adts_header[2] |= (0 << 1);             //private bit:0                   1bit
    p_adts_header[2] |= (channels & 0x04)>>2; //channel configuration:channels  高1bit

    p_adts_header[3] = (channels & 0x03)<<6; //channel configuration:channels 低2bits
    p_adts_header[3] |= (0 << 5);               //original：0                1bit
    p_adts_header[3] |= (0 << 4);               //home：0                    1bit
    p_adts_header[3] |= (0 << 3);               //copyright id bit：0        1bit
    p_adts_header[3] |= (0 << 2);               //copyright id start：0      1bit
    p_adts_header[3] |= ((adtsLen & 0x1800) >> 11);           //frame length：value   高2bits

    p_adts_header[4] = (uint8_t)((adtsLen & 0x7f8) >> 3);     //frame length:value    中间8bits
    p_adts_header[5] = (uint8_t)((adtsLen & 0x7) << 5);       //frame length:value    低3bits
    p_adts_header[5] |= 0x1f;                                 //buffer fullness:0x7ff 高5bits
    p_adts_header[6] = 0xfc;      //‭11111100‬       //buffer fullness:0x7ff 低6bits
    // number_of_raw_data_blocks_in_frame：
    //    表示ADTS帧中有number_of_raw_data_blocks_in_frame + 1个AAC原始帧。

    return 0;
}

全部代码：

#include <stdio.h>
#include <libavutil/log.h>
#include <libavformat/avio.h>
#include <libavformat/avformat.h>
#include <libavcodec/avcodec.h>

#define ADTS_HEADER_LEN  7;

const int sampling_frequencies[] = {
    96000,  // 0x0
    88200,  // 0x1
    64000,  // 0x2
    48000,  // 0x3
    44100,  // 0x4
    32000,  // 0x5
    24000,  // 0x6
    22050,  // 0x7
    16000,  // 0x8
    12000,  // 0x9
    11025,  // 0xa
    8000   // 0xb
    // 0xc d e f是保留的
};

int adts_header(char * const p_adts_header, const int data_length,
                const int profile, const int samplerate,
                const int channels)
{

    int sampling_frequency_index = 3; // 默认使用48000hz
    int adtsLen = data_length + 7;

    int frequencies_size = sizeof(sampling_frequencies) / sizeof(sampling_frequencies[0]);
    int i = 0;
    for(i = 0; i < frequencies_size; i++)
    {
        if(sampling_frequencies[i] == samplerate)
        {
            sampling_frequency_index = i;
            break;
        }
    }
    if(i >= frequencies_size)
    {
        printf("unsupport samplerate:%d\n", samplerate);
        return -1;
    }

    p_adts_header[0] = 0xff;         //syncword:0xfff                          高8bits
    p_adts_header[1] = 0xf0;         //syncword:0xfff                          低4bits
    p_adts_header[1] |= (0 << 3);    //MPEG Version:0 for MPEG-4,1 for MPEG-2  1bit
    p_adts_header[1] |= (0 << 1);    //Layer:0                                 2bits
    p_adts_header[1] |= 1;           //protection absent:1                     1bit

    p_adts_header[2] = (profile)<<6;            //profile:profile               2bits
    p_adts_header[2] |= (sampling_frequency_index & 0x0f)<<2; //sampling frequency index:sampling_frequency_index  4bits
    p_adts_header[2] |= (0 << 1);             //private bit:0                   1bit
    p_adts_header[2] |= (channels & 0x04)>>2; //channel configuration:channels  高1bit

    p_adts_header[3] = (channels & 0x03)<<6; //channel configuration:channels 低2bits
    p_adts_header[3] |= (0 << 5);               //original：0                1bit
    p_adts_header[3] |= (0 << 4);               //home：0                    1bit
    p_adts_header[3] |= (0 << 3);               //copyright id bit：0        1bit
    p_adts_header[3] |= (0 << 2);               //copyright id start：0      1bit
    p_adts_header[3] |= ((adtsLen & 0x1800) >> 11);           //frame length：value   高2bits

    p_adts_header[4] = (uint8_t)((adtsLen & 0x7f8) >> 3);     //frame length:value    中间8bits
    p_adts_header[5] = (uint8_t)((adtsLen & 0x7) << 5);       //frame length:value    低3bits
    p_adts_header[5] |= 0x1f;                                 //buffer fullness:0x7ff 高5bits
    p_adts_header[6] = 0xfc;      //‭11111100‬       //buffer fullness:0x7ff 低6bits
    // number_of_raw_data_blocks_in_frame：
    //    表示ADTS帧中有number_of_raw_data_blocks_in_frame + 1个AAC原始帧。

    return 0;
}

int main(int argc, char *argv[])
{
    int ret = -1;
    char errors[1024];

    char *in_filename = NULL;
    char *aac_filename = NULL;

    FILE *aac_fd = NULL;

    int audio_index = -1;
    int len = 0;


    AVFormatContext *ifmt_ctx = NULL;
    AVPacket pkt;

    // 设置打印级别
    av_log_set_level(AV_LOG_DEBUG);

    if(argc < 3)
    {
        av_log(NULL, AV_LOG_DEBUG, "the count of parameters should be more than three!\n");
        return -1;
    }

    in_filename = argv[1];      // 输入文件
    aac_filename = argv[2];     // 输出文件

    if(in_filename == NULL || aac_filename == NULL)
    {
        av_log(NULL, AV_LOG_DEBUG, "src or dts file is null, plz check them!\n");
        return -1;
    }

    aac_fd = fopen(aac_filename, "wb");
    if (!aac_fd)
    {
        av_log(NULL, AV_LOG_DEBUG, "Could not open destination file %s\n", aac_filename);
        return -1;
    }

    // 打开输入文件
    if((ret = avformat_open_input(&ifmt_ctx, in_filename, NULL, NULL)) < 0)
    {
        av_strerror(ret, errors, 1024);
        av_log(NULL, AV_LOG_DEBUG, "Could not open source file: %s, %d(%s)\n",
               in_filename,
               ret,
               errors);
        return -1;
    }

    // 获取解码器信息
    if((ret = avformat_find_stream_info(ifmt_ctx, NULL)) < 0)
    {
        av_strerror(ret, errors, 1024);
        av_log(NULL, AV_LOG_DEBUG, "failed to find stream information: %s, %d(%s)\n",
               in_filename,
               ret,
               errors);
        return -1;
    }

    // dump媒体信息
//    av_dump_format(ifmt_ctx, 0, in_filename, 0);

    // 初始化packet
    av_init_packet(&pkt);

    // 查找audio对应的steam index
    audio_index = av_find_best_stream(ifmt_ctx, AVMEDIA_TYPE_AUDIO, -1, -1, NULL, 0);
    if(audio_index < 0)
    {
        av_log(NULL, AV_LOG_DEBUG, "Could not find %s stream in input file %s\n",
               av_get_media_type_string(AVMEDIA_TYPE_AUDIO),
               in_filename);
        return AVERROR(EINVAL);
    }

    // 打印AAC级别
    printf("audio profile:%d, FF_PROFILE_AAC_LOW:%d\n",
           ifmt_ctx->streams[audio_index]->codecpar->profile,
           FF_PROFILE_AAC_LOW);

    if(ifmt_ctx->streams[audio_index]->codecpar->codec_id != AV_CODEC_ID_AAC)
    {
        printf("the media file no contain AAC stream, it's codec_id is %d\n",
               ifmt_ctx->streams[audio_index]->codecpar->codec_id);
        goto failed;
    }
    // 读取媒体文件，并把aac数据帧写入到本地文件
    while(av_read_frame(ifmt_ctx, &pkt) >=0 )
    {
        if(pkt.stream_index == audio_index)
        {
            char adts_header_buf[7] = {0};
            adts_header(adts_header_buf, pkt.size,
                        ifmt_ctx->streams[audio_index]->codecpar->profile,
                        ifmt_ctx->streams[audio_index]->codecpar->sample_rate,
                        ifmt_ctx->streams[audio_index]->codecpar->ch_layout.nb_channels);
            fwrite(adts_header_buf, 1, 7, aac_fd);  // 写adts header , ts流不适用，ts流分离出来的packet带了adts header
            len = fwrite( pkt.data, 1, pkt.size, aac_fd);   // 写adts data
            if(len != pkt.size)
            {
                av_log(NULL, AV_LOG_DEBUG, "warning, length of writed data isn't equal pkt.size(%d, %d)\n",
                       len,
                       pkt.size);
            }
        }
        av_packet_unref(&pkt);
    }

failed:
    // 关闭输入文件
    if(ifmt_ctx)
    {
        avformat_close_input(&ifmt_ctx);
    }
    if(aac_fd)
    {
        fclose(aac_fd);
    }

    return 0;
}