FFMPEG开发快速入坑——视频转换处理

最新推荐文章于 2024-06-11 22:52:55 发布

音视频开发老马

最新推荐文章于 2024-06-11 22:52:55 发布

阅读量1.4k

点赞数

文章标签： ffmpeg 音视频

本文链接：https://blog.csdn.net/yinshipin007/article/details/130976875

版权

本章节重点讲解FFMPEG中对于视频图像格式转换的处理。

一、视频格式转换的基本API
视频帧图像的格式转换、缩放等处理，主要使用 libswscale库中的API函数完成的

sws_getContext() 根据要输入输出图像的宽高和像素格式创建转换器
sws_scale() 根据输入图像数据进行实际的转换操作，结果输出到输出缓冲区上
sws_freeContext()释放转换器

这几个API函数的功能比较明确，关键是参数的设置，特别是sws_scale()几个参数的设置，具体的参数值依赖于相应的视频帧图像格式。

二、常用的视频帧图像格式

YUV420P格式

在YUV420P的存储格式中，每4个像素点占用4个Y、1个U、1个V，Y分量、U分量、V分量的数据分别单独存放，对应AVFrame结构体中字段

typedef struct AVFrame {
  ......
  //
  // 视频帧图像数据 或者 音频帧PCM数据, 根据不同的格式有不同的存放方式
  // 对于视频帧：RGB/RGBA 格式时 data[0] 中一次存放每个像素的RGB/RGBA数据
  //            YUV420 格式时 data[0]存放Y数据;  data[1]存放U数据; data[2]存放V数据
  // 对于音频帧: data[0]存放左声道数据;  data[1]存放右声道数据
  //
  uint8_t *data[AV_NUM_DATA_POINTERS];  
  
  //
  // 行字节跨度, 相当于stride
  // 对于视频帧: 上下两行同一列像素相差的字节数,例如：对于RGBA通常是(width*4), 但是有时FFMPEG内部会有扩展, 可能会比这个值大
  // 对于音频帧: 单个通道中所有采样占用的字节数
  //
  int linesize[AV_NUM_DATA_POINTERS];
  
  int format;         // 对于视频帧是图像格式; 对于音频帧是采样格式  
  int64_t pts;        // 当前数据帧的时间戳  
  int width, height;  // 仅用于视频帧, 宽度高度
  int key_frame;      // 仅用于视频, 当前是否是I帧
  ......
}

以一张 720*1280的视频帧图像为例&#

最低0.47元/天解锁文章

音视频开发老马

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
FFMPEG开发快速入坑——视频转换处理

但是在FFMPEG内部编解码器处理时需要处理图像边界等问题，很多时候为了方便优化处理，通常内部创建的图像缓冲区要比输出的原始图像要大一些，而输出的图像内容只是出于缓冲区中的一部分，此时要输出图像要么创建一个新的缓冲区做一次图像拷贝，要么直接将这个缓冲区输出，避免一次拷贝，FFMPEG就是采用后面一种方式少了一次拷贝。其他的格式是packed存储模式，即：各个通道数据是交错存储在一起，此时数据访问只能通过data[0]来进行偏移计算， data[1], data[2],..... 等都是空的。
复制链接

扫一扫