FFmpeg编程入门

播放器框架

在这里插入图片描述

常用音视频术语

  • 容器/文件(Conainer/File):即特定格式的多媒体文件,比如mp4、flv、mkv等。
  • 媒体流(Stream):表示时间轴上的一段连续数据,如一段声音数据、一段视频数据或一段字幕数据,可以是压缩的,也可以是非压缩的,压缩的数据需要关联特定的编解码器(有些码流音频他是纯PCM)。
  • 数据帧/数据包(Frame/Packet):通常,一个媒体流是由大量的数据帧组成的,对于压缩数据,帧对应着编解码器的最小处理单元,分属于不同媒体流的数据帧交错存储于容器之中。
  • 编解码器:编解码器是以帧为单位实现压缩数据和原始数据之间的相互转换的。

常用概念-复用器

在这里插入图片描述

常用概念-编解码器

在这里插入图片描述

FFmpeg库简介

在这里插入图片描述

FFMPEG有8个常用库

  • AVUtil:核心工具库,下面的许多其他模块都会依赖该库做一些基本的音视频处理操作
  • AVFormat:文件格式和协议库,该模块是最重要的模块之一,封装了Protocol层和Demuxer、Muxer层,使得协议和格式对于开发者来说是透明的。
  • AVCodec:编解码库,封装了Codec层,但是有一些Codec是具备自己的License的,FFmpeg是不会默认添加像libx264、FDK-AAC等库的,但是FFmpeg就像一个平台一样,可以将其他的第三方的Codec以插件的方式添加进来,然后为开发者提供统一的接口。
  • AVFilter:音视频滤镜库,该模块提供了包括音频特效和视频特效的处理,在使用FFmpeg的API进行编解码的过程中,直接使用该模块为音视频数据做特效处理是非常方便同时也非常高效的一种方式。
  • AVDevice:输入输出设备库,比如,需要编译出播放声音或者视频的工具ffplay,就需要确保该模块是打开的,同时也需要SDL的预先编译,因为该设备模块播放声音与播放视频使用的都是SDL库。
  • SwrRessample:该模块可用于音频重采样,可以对数字音频进行声道数、数据格式、采样率等多种基本信息的转换。
  • SWScale:该模块是将图像进行格式转换的模块,比如,可以将YUV的数据转换为RGB的数据,缩放尺寸由1280720变为800480。
  • PostProc:该模块可用于进行后期处理,当我们使用AVFilter的时候需要打开该模块的开关,因为Filter中会使用到该模块的一些基础函数。

FFmpeg函数简介

注册相关函数

av_register_all():注册所有组件,4.0已经弃用
avdevice_register_all()对设备进行注册,比如V4L2等。
avformat_network_init();初始化网络库以及网络加密协议相关的库(比如openssl)

FFmpeg 3.x 组件注册方式

我们使用ffmpeg,首先要执行av_register_all,把全局的解码器、编码器等结
构体注册到各自全局的对象链表里,以便后面查找调用。
在这里插入图片描述

FFmpeg 4.x 组件注册方式

FFmpeg内部去做,不需要用户调用API去注册。
以codec编解码器为例:
在configure的时候生成要注册的组件

  1. ./configure:7203:print_enabled_components libavcodec/codec_list.c AVCodec codec_list $CODEC_LIST 这里会生成一个codec_list.c 文件,里面只有static
    const AVCodec * const **codec_list[]**数组。
  2. libavcodec/allcodecs.c将static const AVCodec * const
    codec_list[] 的编解码器用链表的方式组织起来。
Ffmpeg 4.0.2 组件注册方式

FFmepg内部去做,不需要用户调用API去注册。
对于demuxer/muxer(解复用器,也称容器)则对应
3. libavformat/muxer_list.c
libavformat/demuxer_list.c 这两个文件也是在configure的时候生成,
也就是说直接下载源码是没有这两个文件的。
4. 在libavformat/allformats.c将demuxer_list[]和muexr_list[]以链表的方
式组织。
其他组件也是类似的方式

封装格式相关

avformat_alloc_context();负责申请一个AVFormatContext结构的内存,并进行简单初始化
avformat_free_context();释放该结构里的所有东西以及该结构本身
avformat_close_input();关闭解复用器。关闭后就不再需要使用avformat_free_context 进行释放。
avformat_open_input();打开输入视频文件
avformat_find_stream_info():获取音视频文件信息
av_read_frame(); 读取音视频包
avformat_seek_file(); 定位文件
av_seek_frame():定位文件
在这里插入图片描述

解封装格式相关

在这里插入图片描述
ffmpeg 的 Mux 主要分为 三步操作:

  1. avformat_write_header : 写文件头
  2. av_write_frame/av_interleaved_write_frame: 写packet
  3. av_write_trailer: 写⽂件尾
编码相关

在这里插入图片描述

  • avcodec_find_encoder:根据指定的AVCodecID查找注册的编码器
  • avcodec_alloc_context3:为AVCodecContext分配内存。
  • avcodec_open2:打开编码器。
  • avcodec_send_frame:将AVFrame⾮压缩数据给编码器。
  • avcodec_receive_packet:获取到编码后的AVPacket数据,收到的packet需要⾃⼰释放内存。
  • av_frame_get_buffer: 为⾳频或视频帧分配新的buffer。在调⽤这个函数之前,必须在AVFame上设置好以下属性:format(视频为像素格式,⾳频为样本格式)、nb_samples(样本个数,针对⾳频)、channel_layout(通道类型,针对⾳频)、width/height(宽⾼,针对视频)。
  • av_frame_make_writable:确保AVFrame是可写的,使av_frame_make_writable()的问题是,在最坏的情况下,它会在您使⽤encode再次更改整个输⼊frame之前复制它. 如果frame不可写,av_frame_make_writable()将分配新的缓冲区,并复制这个输⼊input frame数据,避免和编码器需要缓存该帧时造成冲突。 av_samples_fill_arrays 填充⾳频帧
解码相关
  • avcodec_alloc_context3(): 分配解码器上下文 avcodec_find_decoder():根据ID查找解码器
  • avcodec_find_decoder_by_name():根据解码器名字 avcodec_open2(): 打开编解码器
  • avcodec_decode_video2():解码一帧视频数据
  • avcodec_decode_audio4():解码一帧音频数据
  • avcodec_send_packet(): 发送编码数据包 avcodec_receive_frame(): 接收解码后数据
  • avcodec_free_context():释放解码器上下文,包含了 avcodec_close()
  • avcodec_close():关闭解码器
  • 在这里插入图片描述

FFmpeg数据结构

  • AVFormatContext
    封装格式上下文结构体,也是统领全局的结构体,保存了视频文件封装格式相关信息。 AVInputFormat

  • demuxer
    每种封装格式(例如FLV, MKV, MP4, AVI)对应一个该结构体。

  • AVOutputFormat muxer

  • AVStream
    视频文件中每个视频(音频)流对应一个该结构体。
    AVCodecContext编解码器上下文结构体,保存了视频(音频)编解码相关信息。

  • AVCodec
    每种视频(音频)编解码器(例如H.264解码器)对应一个该结构体。

  • AVPacket
    存储一帧压缩编码数据。

  • AVFrame
    存储一帧解码后像素(采样)数据

FFmpeg数据结构分析

  • AVFormatContext
    iformat:输入媒体的AVInputFormat,比如指向AVInputFormat ff_flv_demuxer
    nb_streams:输入媒体的AVStream 个数
    streams:输入媒体的AVStream []数组
    duration:输入媒体的时长(以微秒为单位),计算方式可以参考av_dump_format()函数。
    bit_rate:输入媒体的码率

  • AVInputFormat
    name:封装格式名称
    extensions:封装格式的扩展名
    id:封装格式ID,
    一些封装格式处理的接口函数,比如read_packet()

  • AVStream
    index:标识该视频/音频流
    time_base:该流的时基,PTS*time_base=真正的时间(秒)
    avg_frame_rate: 该流的帧率
    duration:该视频/音频流长度
    codecpar:编解码器参数属性

  • AVCodecParameters
    codec_type:媒体类型,比如AVMEDIA_TYPE_VIDEO,AVMEDIA_TYPE_AUDIO等
    codec_id:编解码器类型, 比如AV_CODEC_ID_H264AV_CODEC_ID_AAC等。

  • AVCodecContext
    codec:编解码器的AVCodec,比如指向AVCodec ff_aac_latm_decoder
    width, height:图像的宽高(只针对视频)
    pix_fmt:像素格式(只针对视频)
    sample_rate:采样率(只针对音频)
    channels:声道数(只针对音频)
    sample_fmt:采样格式(只针对音频)

  • AVCodec
    name:编解码器名称
    type:编解码器类型
    id:编解码器ID
    一些编解码的接口函数,比如int (*decode)()

  • AVPacket
    pts:显示时间戳
    dts:解码时间戳
    data:压缩编码数据
    size:压缩编码数据大小
    pos:数据的偏移地址
    stream_index:所属的AVStream

  • AVFrame
    data:解码后的图像像素数据(音频采样数据)
    linesize:对视频来说是图像中一行像素的大小;对音频来说是整个音频帧的大小
    width, height:图像的宽高(只针对视频)
    key_frame:是否为关键帧(只针对视频) 。 • pict_type:帧类型(只针對视频) 。例如I, P, B • sample_rate:音频采样率(只针对音频)
    nb_samples:音频每通道采样数(只针对音频)
    pts:显示时间戳

FFmpeg数据结构之间的关系

1. AVFormatContext和AVInputFormat之间的关系

AVFormatContext API调用
AVInputFormat 主要是FFMPEG内部调用
数据:
AVFormatContext 封装格式上下文结构体
struct AVInputFormat *iformat;
方法:
AVInputFormat 每种封装格式(例如FLV, MKV, MP4)
int (*read_header)(struct AVFormatContext * );
int (*read_packet)(struct AVFormatContext *, AVPacket *pkt);

2. AVCodecContext和AVCodec之间的关系

数据:
AVCodecContext 编码器上下文结构体
struct AVCodec *codec;
方法:
AVCodec 每种视频(音频)编解码器
int (*decode)(AVCodecContext *, void *outdata, int *outdata_size,
AVPacket *avpkt);
int (*encode2)(AVCodecContext *avctx, AVPacket *avpkt, const AVFrame
*frame, int *got_packet_ptr);

3.AVFormatContext, AVStream和AVCodecContext之间的关系

在这里插入图片描述

4.AVPacket和AVFrame之间的关系

在这里插入图片描述

5.区分不同的码流
  • AVMEDIA_TYPE_VIDEO视频流
    video_index = av_find_best_stream(ic, AVMEDIA_TYPE_VIDEO,
    -1,-1, NULL, 0)
  • AVMEDIA_TYPE_AUDIO音频流
    audio_index = av_find_best_stream(ic, AVMEDIA_TYPE_AUDIO,
    -1,-1, NULL, 0)
  • 3
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值