FFmpeg的scale滤镜介绍

Loken2020

已于 2024-01-02 19:53:44 修改

阅读量5.8k

点赞数 1

分类专栏： FFmpeg滤镜API 文章标签： FFmpeg 滤镜

于 2022-10-26 18:10:19 首次发布

本文链接：https://blog.csdn.net/u012117034/article/details/127537729

版权

FFmpeg滤镜API 专栏收录该内容

7 篇文章

订阅专栏

FFmpeg 的社群来了，想加入微信社群的朋友请购买《FFmpeg原理》VIP版电子书，里有更高级的内容与答疑服务。

FFmpeg 的 scale 滤镜可以将图像的宽高进行调整，缩小或者放大。

FFmpeg 的滤镜是一个非常强大的功能，强大跟庞大是一个意思。从另一个角度解释，FFmpeg 的滤镜其实是一个大杂烩，什么功能都有。

不要被滤镜这个词欺骗，FFmpeg 的滤镜不止可以做一些特效，加水印之类的，还可以裁剪视频时长，转换采样率，或者转换像素格式等等。

本文的代码下载地址：GitHub，里面有 3个项目，会以 scale 滤镜为例分别演示了 3 种使用滤镜函数的方法。其他滤镜也是一样的使用方法。

FFmpeg 的滤镜函数，其实是比较复杂的。

跟滤镜有关的数据结构有以下：

AVFilterGraph，滤镜容器，里面可以有多个 滤镜上下文
AVFilterInOut，滤镜链表，avfilter_graph_parse2 函数有时候会设置这个结构体，开放输入跟输出给其他的滤镜上下文来链接。
AVFilterContext，滤镜上下文，可以看成是滤镜的实例
AVFilter，滤镜信息。

跟滤镜有关的API函数有以下：

avfilter_graph_alloc，创建滤镜容器。
avfilter_get_by_name，根据字符串名字找出 AVFilter
avfilter_graph_create_filter ，根据 AVFilter 来创建创建滤镜上下文。同时会把新创建的滤镜上下文放进去滤镜容器。
avfilter_link，连接两个滤镜上下文。
avfilter_graph_parse2，根据传递的字符串语法来创建一个或者多个滤镜上下文，多个滤镜会根据语法自动连接。同时会把新创建的滤镜上下文放进去滤镜容器。
avfilter_graph_config，正式打开滤镜容器。
avfilter_graph_get_filter，根据名称获取滤镜容器内部的某个 滤镜上下文。
av_buffersrc_add_frame_flags，往滤镜上下文发送一个 AVFrame，让滤镜进行处理。
av_buffersink_get_frame_flags，从滤镜上下文读取已经处理好的 AVFrame。

FFmpeg 里面有两个特殊滤镜，buffer 输入滤镜跟 buffersink 输出滤镜。

一个滤镜容器里面可以有多个buffer 输入滤镜实例，但只能有一个 buffersink 输出滤镜实例。

FFmpeg 的滤镜 API 其实有 3 种调用方法，我个人觉得他是 3 种用法。

1，用 avfilter_graph_create_filter 一个一个地创建滤镜（AVFilterContext），然后用 avfilter_link 函数把各个滤镜的输入输出连接起来，这种方式比较灵活，但是非常繁琐。

2，下面的命令定义了一个滤镜字符串 "[0:v]scale=iw/2:ih/2" ，直接使用 avfilter_graph_parse2 来解析这个字符串。avfilter_graph_parse2 函数内部会根据字符串的语法规则把所有滤镜链接起来。

ffmpeg.exe -i juren-30s.mp4 -filter_complex "[0:v]scale=iw/2:ih/2" output.mp4 -y

上面的 [0:v] ，代表取第一个输入文件的视频流。上面这种就是 ffmpeg.c 里面的滤镜用法。实际上[0:v] 的用法也是比较繁琐，这样会开放输入跟输出给其他滤镜实例来连接，也就是说用了 [0:v]，那你必须调 avfilter_graph_create_filter 新建 buffer/buffersink 滤镜实例来连接 AVFilterInOut，如果有多个输入文件，你要调多次 avfilter_graph_create_filter 。

3，第三种使用滤镜的方法，其实也是定义一个字符串，然后丢给 avfilter_graph_parse2 函数，只不过这个字符串是这样的。如下：

"buffer=video_size=%dx%d:pix_fmt=%d:time_base=%d/%d:pixel_aspect=%d/%d:frame_rate=%d/%d[main];"
"[main]scale=%d:%d[result];"
"[result]buffersink"

上面的字符串直接定义了 buffer/buffersink 的规则，上面的字符串丢给 avfilter_graph_parse2 的时候，他会自动创建 buffer/buffersink 滤镜。如果有多个输入文件，直接加一行 buffer 字符串即可。

第三种用法，我个人觉得是最简单的，根本不用管那个 AVFilterInOut 的数据结构。

上面 3种使用滤镜的方法本文都会讲解，现在先来讲第三种用法，因为最简单，请打开 scale-3 项目的代码。

下面就结合本文的 scale-3 项目代码来理解一下上面的数据结构跟函数，请看下图：

上图是初始化跟打开一个滤镜的代码，函数调用如下：

avfilter_graph_alloc ➔ avfilter_graph_parse2 ➔ avfilter_graph_config。

上面这 3个函数的调用比较容易看懂。比较不容易明了的是低下那两行代码，如下：

 //根据 名字 找到 AVFilterContext
 mainsrc_ctx = avfilter_graph_get_filter(filter_graph, "Parsed_buffer_0");
 resultsink_ctx = avfilter_graph_get_filter(filter_graph, "Parsed_buffersink_2");

avfilter_graph_parse2 函数接受字符串 "Parsed_buffer_0" ，"Parsed_buffer_2"。

这两个字符串是怎么算出的呢？

往滤镜容器创建滤镜上下文的时候，每个滤镜上下文都有一个名字的，这个名字的规则如下：

name 就是字符串里面的 buffer 或者 buffersink。 index 是什么呢？ index 代表第几个滤镜上下文。

第一个滤镜上下文是 buffer= .... [main] ，这个的 index 就是 0，拼起来就是 Parsed_buffer_0。这是一个 buffer 滤镜（输入滤镜）

第二个滤镜上下文是 [main]scale=%d:%d[result]，这是一个 scale 滤镜，拼起来是 Parsed_scale_1 ，不过这个滤镜我们 scale-3 项目代码没调出来不用管。

第三个滤镜上下文是 [result]buffersink，这是一个 buffersink 滤镜（输出滤镜）

现在，只要往 buffer 滤镜上下文发 AVFrame，从 buffersink 滤镜上下文读 AVFrame，就可以了。图像缩小了一倍。代码如下：

最后，就需要释放滤镜相关的内存，释放也很简单，因为无论是通过 avfilter_graph_create_filter 还是 avfilter_graph_parse2 创建的滤镜上下文，都放进去了滤镜容器里面。

所以只需要调 avfilter_graph_free 来释放滤镜容器即可，容器里面的滤镜上下文都会全部释放。

//释放滤镜。
avfilter_graph_free(&filter_graph);

下面我们继续讲第一种最原始的创建滤镜的方法，里面没有用到字符串滤镜语法。完全是一个一个滤镜创建，然后连接起来的。

请打开 scale-1 项目的代码。请看下图：

上图中的函数调用流程如下：

avfilter_graph_alloc ➔ avfilter_graph_create_filter ➔ avfilter_link ➔ avfilter_graph_create_filter ➔ avfilter_link ➔ avfilter_graph_config

可以看出了，如果滤镜很多，要写很多代码，但是这种原始的方式是最灵活的，你想怎么链接都可以。

avfilter_link 函数有一个重点，就是第二第四个参数，这是一个下标，本文填0即可，这两个参数特别重要，在《FFmpeg的split滤镜介绍》文章有讲解。

scale-1 项目的代码没有使用 avfilter_graph_parse2 函数。

至此，第一种使用滤镜的方法也讲解完毕了。

最后讲第二种调用滤镜函数的方法，代码在 scale-2 项目里面，这种方法就是 ffmpeg.c 里面的滤镜用法，可以说是官方用法。

scale-2 项目的代码虽然跟 ffmpeg.c 用的同一种滤镜调用方法，但是 ffmpeg.c 里面的滤镜功能更加复杂，因为他要根据 [0:v] 定位到哪个文件哪个流。

FFmpeg 为了实现这些命令行滤镜功能，导致 ffmpeg.c 里面的滤镜代码非常复杂，但实际上，滤镜函数的调用，难度其实是跟 scale-2 项目一样的。

下面就我们一起探索 scale-2 项目的代码，请看下图：

上面的代码是创建 buffer ctx 跟 buffersink ctx，跟之前一样。

继续看后面代码，如下：

实际上第二种方法，我个人觉得是专门为 ffmpeg.c 准备的，如果你是一个库使用者，使用本文的第三种方法即可。

scale-2 项目由于传给 avfilter_graph_parse2 函数的字符串没有定义 buffer 跟 buffersink，所以默认不会创建这两个滤镜上下文。但是他会提供 AVFilterInOut 开放入口跟出口给你自己创建的 buffer 跟 buffersink 来连接。

上面我打印了一些 cur 变量的值，运行结果如下：