目录
FFmpeg库简介
FFmpeg函数简介
FFmpeg函数简介-封装格式相关
FFmpeg解码函数简介-解码器相关
FFmpeg 3.x 组件注册方式
FFmpeg 4.x 组件注册方式
Ffmpeg 4.0.2 组件注册方式
FFmpeg数据结构简介
FFmpeg数据结构之间的关系
AVFormatContext和AVInputFormat之间的关系
AVCodecContext和AVCodec之间的关系
FFmpeg数据结构之间的关系
FFmpeg数据结构分析
FFmpeg库简介
AVUtil | 核心工具库,下面的许多其他模块都会依赖该库做一些基本的音视频处理操作。 |
AVFormat | 文件格式和协议库,该模块是最重要的模块之一,封装了Protocol层和Demuxer、 Muxer层,使得协议和格式对于开发者来说是透明的。 |
AVCodec | 编解码库,封装了Codec层,但是有一些Codec是具备自己的License的, FFmpeg是不会默认添加像libx264、 FDK-AAC等库的,但是FFmpeg就像一个平台一样,可以将其他的第三方的Codec以插件的方式添加进来,然后为开发者提供统一的接口。 |
AVFilter | 音视频滤镜库,该模块提供了包括音频特效和视频特效的处理,在使用FFmpeg的API进行编解码的过程中,直接使用该模块为音视频数据做特效处理是非常方便同时也非常高效的一种方式。 |
AVDevice | 输入输出设备库,比如,需要编译出播放声音或者视频的工具ffplay,就需要确保该模块是打开的,同时也需要SDL的预先编译,因为该设备模块播放声音与播放视频使用的都是SDL库。 |
SwrRessample | 该模块可用于音频重采样,可以对数字音频进行声道数、数据格式、采样率等多种基本信息的转换。 |
SWScale | 该模块是将图像进行格式转换的模块,比如,可以将YUV的数据转换为RGB的数据,缩放尺寸由1280*720变为800*480。 |
PostProc | 该模块可用于进行后期处理,当我们使用AVFilter的时候需要打开该模块的开关,因为Filter中会使用到该模块的一些基础函数。 |
FFmpeg函数简介
av_register_all() | 注册所有组件,4.0已经弃用 |
avdevice_register_all() | 对设备进行注册,比如V4L2等。 |
avformat_network_init(); | 初始化网络库以及网络加密协议相关的库(比如openssl) |
FFmpeg函数简介-封装格式相关
avformat_alloc_context() | 负责申请一个AVFormatContext结构的内存,并进行简单初始化 |
avformat_free_context() | 释放该结构里的所有东西以及该结构本身 |
avformat_close_input() | 关闭解复用器。关闭后就不再需要使用avformat_free_context 进行释放。 |
avformat_open_input() | 打开输入音视频文件 |
avformat_find_stream_info() | 获取音视频文件信息 |
av_read_frame() | 读取音视频包 |
avformat_seek_file() | 定位文件(可通过时间定位) |
av_seek_frame() | 定位文件(可通过文件大小定位) |
FFmpeg解码函数简介-解码器相关
avcodec_alloc_context3() | 分配解码器上下文 |
avcodec_find_decoder() | 根据ID查找解码器 |
avcodec_find_decoder_by_name() | 根据解码器名字 |
avcodec_open2() | 打开编解码器 |
avcodec_decode_video2() | 解码一帧视频数据(不建议使用) |
avcodec_decode_audio4() | 解码一帧音频数据(不建议使用) |
avcodec_send_packet() | 发送编码数据包 |
avcodec_receive_frame() | 接收解码后数据 |
avcodec_free_context() | 释放解码器上下文,包含了avcodec_close() |
avcodec_close() | 关闭解码器 |
- avcodec_find_decoder():
- avcodec_find_decoder_by_name():
- 根据指定的名字查找,如果找不到指定名字,就是没有找到。
- 如果上下文保存在解码器里面,多路解码的时候肯定有冲突。
- 设计解码器要做到可重入,通过AVCodexContex保存解码后的上下文数据
- AVCodexContex,avcosex_open2():让解码器和上下文做关联。
FFmpeg 3.x 组件注册方式
- 使用ffmpeg,首先要执行av_register_all,把全局的解码器、编码器等结构体注册到各自全局的对象链表里,以便后面查找调用
FFmpeg 4.x 组件注册方式
- FFmpeg内部去做,不需要用户调用API去注册。
- 以codec编解码器为例:
./configure:7203:print_enabled_components libavcodec/codec_list.c AVCodec codec_list $CODEC_LIST
- 这里会生成一个codec_list.c 文件,里面只有static const AVCodec * const codec_list[]数组。
- 2. 在libavcodec/allcodecs.c将static const AVCodec * const codec_list[]的编解码器用链表的方式组织起来
Ffmpeg 4.0.2 组件注册方式
- FFmepg内部去做,不需要用户调用API去注册。
- 对于demuxer/muxer(解复用器,也称容器)则对应
- 1. libavformat/muxer_list.c
- libavformat/demuxer_list.c 这两个文件也是在configure的时候生成,也就是说直接下载源码是没有这两个文件的。
- 2. 在libavformat/allformats.c将demuxer_list[]和muexr_list[]以链表的方式组织。
- 其他组件也是类似的方式
FFmpeg数据结构简介
AVFormatContext | 封装格式上下文结构体,也是统领全局的结构体,保存了视频文件封装格式相关信息。 |
AVInputFormat demuxer AVOutputFormat muxer | 每种封装格式(例如FLV, MKV, MP4, AVI)对应一个该结构体。 |
AVStream | 视频文件中每个视频(音频)流对应一个该结构体。 |
AVCodecContext | 编解码器上下文结构体,保存了视频(音频)编解码相关信息。 |
AVCodec | 每种视频(音频)编解码器(例如H.264解码器)对应一个该结构体。 |
AVPacket | 存储一帧压缩编码数据。 |
AVFrame | 存储一帧解码后像素(采样)数据。 |
FFmpeg数据结构之间的关系
AVFormatContext和AVInputFormat之间的关系
- AVFormatContext API调用
- AVInputFormat 主要是FFMPEG内部调用
- 数据
- AVFormatContext 封装格式上下文结构体
- struct AVInputFormat *iformat;
- 方法:所有的方法可重入的
- AVInputFormat 每种封装格式(例如FLV, MKV, MP4)
- int (*read_header)(struct AVFormatContext *);
- int (*read_packet)(struct AVFormatContext *, AVPacket *pkt);
int avformat_open_input(AVFormatContext **ps, const char *filename,
AVInputFormat *fmt, AVDictionary **options)
AVCodecContext和AVCodec之间的关系
- 数据
- AVCodecContext 编码器上下文结构体
- struct AVCodec *codec;
- 方法:
int (*decode)(AVCodecContext *, void *outdata, int *outdata_size, AVPacket *avpkt);
int (*encode2)(AVCodecContext *avctx, AVPacket *avpkt, const AVFrame *frame, int *got_packet_ptr);
FFmpeg数据结构之间的关系
- AVFormatContext, AVStream和AVCodecContext之间的关系
- 区分不同的码流(AVPacket 里面也有一个index的字段)
video_index = av_find_best_stream(ic, AVMEDIA_TYPE_VIDEO, -1,-1, NULL, 0)
audio_index = av_find_best_stream(ic, AVMEDIA_TYPE_AUDIO, -1,-1, NULL, 0)
FFmpeg数据结构分析
iformat | 输入媒体的AVInputFormat,比如指向AVInputFormatff_flv_demuxer |
nb_streams | 输入媒体的AVStream 个数 |
streams | 输入媒体的AVStream []数组 |
duration | 输入媒体的时长(以微秒为单位),计算方式可以参考av_dump_format()函数 |
bit_rate | 输入媒体的码率 |
name | 封装格式名称 |
extensions | 封装格式的扩展名 |
id | 封装格式ID |
一些封装格式处理的接口函数 | 比如read_packet() |
index | 标识该视频/音频流 |
time_base | 该流的时基, PTS*time_base=真正的时间(秒) |
avg_frame_rate | 该流的帧率 |
duration | 该视频/音频流长度 |
codecpar | 编解码器参数属性 |
codec_type | 媒体类型,比如AVMEDIA_TYPE_VIDEO AVMEDIA_TYPE_AUDIO等 |
codec_id | 编解码器类型, 比如AV_CODEC_ID_H264 AV_CODEC_ID_AAC |
codec | 编解码器的AVCodec,比如指向AVCodecff_aac_latm_decoder |
width, height | 图像的宽高(只针对视频) |
pix_fmt | 像素格式(只针对视频) |
sample_rate | 采样率(只针对音频) |
channels | 声道数(只针对音频) |
sample_fmt | 采样格式(只针对音频) |
name | 编解码器名称 |
type | 编解码器类型 |
id | 编解码器ID |
一些编解码的接口函数 | 比如int (*decode)() |
pts | 显示时间戳 |
dts | 解码时间戳 |
data | 压缩编码数据 |
size | 压缩编码数据大小 |
pos | 数据的偏移地址 |
stream_index | 所属的AVStream |
data | 解码后的图像像素数据(音频采样数据) |
linesize | 对视频来说是图像中一行像素的大小;对音频来说是整个音频帧的大小 |
width, height | 图像的宽高(只针对视频) |
key_frame | 是否为关键帧(只针对视频) |
pict_type | 帧类型(只针对视频) 。例如I, P, B |
sample_rate | 音频采样率(只针对音频) |
nb_samples | 音频每通道采样数(只针对音频) |
pts | 显示时间戳 |