FFmpeg源码分析：视频滤镜介绍(下)

最新推荐文章于 2024-05-15 16:34:02 发布

音视频开发老马

最新推荐文章于 2024-05-15 16:34:02 发布

阅读量551

点赞数

文章标签： ffmpeg 音视频

本文链接：https://blog.csdn.net/yinshipin007/article/details/130140849

版权

FFmpeg在libavfilter模块提供音视频滤镜。所有的视频滤镜都注册在libavfilter/allfilters.c。我们也可以使用ffmpeg -filters命令行来查看当前支持的所有滤镜，前面-v代表视频。本篇文章主要介绍视频滤镜，包括：绘制文字、边缘检测、淡入淡出、高斯模糊、左右镜像、图层叠加、视频旋转。

关于视频滤镜的详细介绍，可查看官方文档：视频滤镜。视频滤镜介绍的上半部分，可以查看上一篇文章：视频滤镜介绍(上)。

1、drawtext

绘制文字，在视频画面上绘制文本文字。需要开启freetype第三方库--enable-freetype，详细介绍可查看：freetype官网。如果要设置字体大小、颜色，需要开启fontconfig第三方库--enable-fontconfig，详情可查看：fontconfig官网。如果要设置字体形状，需要开启libfribidi第三方库--enable-libfribidi，详情可查看：fribidi的GitHub网站。

参数选项如下：

box：是否使用背景颜色绘制矩形框， 1 (开启) 或0 (关闭)，默认为关闭 boxborderw：绘制矩形边框的宽度，默认为0 boxcolor：绘制矩形边框的颜色，默认为白色 line_spacing：行距，默认为0 basetime：开始计时时间，单位微秒 fontcolor：字体颜色，默认为黑色 font：字体，默认为Sans fontfile：字体文件，需要文件的绝对路径 alpha：文字的混合透明通道alpha值，范围为[0.0, 1.0]，默认为1.0 fontsize：字体大小，默认为16 shadowcolor：阴影颜色，默认为黑色 shadowx、shadowy：文本阴影相对于文本的x、y偏移量 timecode：时间码，默认格式为 "hh:mm:ss[:;.]ff" text：字符串文本，必须为UTF-8编码格式 textfile：文本文件，必须为UTF-8编码格式 main_h, h, H：输入高度 main_w, w, W：输入宽度 n：从哪一帧开始绘制文本，默认为0 t：时间戳表达式，单位为秒, NAN为未知值 text_h, th：文字高度 text_w, tw：文字宽度 x、y：文本在视频画面的xy坐标点，作为渲染文本的起始位置绘制文本参考命令，指定文本、xy坐标点、字体大小、字体颜色：

ffmpeg -i in.mp4 -vf drawtext="text='Hello world:x=10:y=20:fontcolor=red" watermark.mp4

添加文字水印的效果如下图所示：

2、edgedetect

边缘检测，用于检测与绘制边缘，使用Canny边缘检测算法。关于Canny边缘检测算法原理，详情可查看：Canny边缘检测的维基百科。边缘检测步骤如下：

(1) 应用高斯滤波器平滑图像以去除噪声 (2) 计算图像的梯度与方向 (3) 应用梯度幅度阈值或下限截止抑制来消除对边缘检测的虚假响应 (4) 应用双阈值来确定潜在边缘 (5) 滞后跟踪边缘：抑制所有其他弱且未连接到强边缘的边缘参数选项如下：

low、high：Canny边缘检测阈值，范围 [0,1]，默认最小值为20/255, 默认最大值为50/255 mode：绘制模式，默认为wire，所有模式如下所示： ‘wires’：黑色背景中绘制白灰连线 ‘colormix’：混合颜色，类似绘画卡通效果 ‘canny’：每个平面都进行Canny检测 planes：是否开启平面过滤，默认开启

2.1 边缘检测算法

边缘检测的代码位于libavfilter/vf_edgedetect.c，操作步骤包括高斯滤波、sobel算子、消除响应、双阈值寻找潜在边缘、滞后跟踪边缘，核心代码如下：

static int filter_frame(AVFilterLink *inlink, AVFrame *in)
{
    ......
    // 从缓冲区获取视频帧数据
    out = ff_get_video_buffer(outlink, outlink->w, outlink->h);
    
    for (p = 0; p < edgedetect->nb_planes; p++) {
        ......
        // 高斯滤波，图像降噪处理
        gaussian_blur(ctx, width, height,
                      tmpbuf,      width,
                      in->data[p], in->linesize[p]);
 
        // sobel算子: 计算图像梯度和方向
        sobel(width, height,
              gradients, width,
              directions,width,
              tmpbuf,    width);
 
        memset(tmpbuf, 0, width * height);
        // 应用梯度阈值消除虚假响应
        non_maximum_suppression(width, height,
                                tmpbuf,    width,
                                directions,width,
                                gradients, width);
 
        // 应用高低位双阈值来确定潜在边缘
        double_threshold(edgedetect->low_u8, edgedetect->high_u8,
                         width, height,
                         out->data[p], out->linesize[p],
                         tmpbuf,       width);
        // 颜色混合，滞后跟踪边缘
        if (edgedetect->mode == MODE_COLORMIX) {
            color_mix(width, height,
                      out->data[p], out->linesize[p],

最低0.47元/天解锁文章

音视频开发老马

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
FFmpeg源码分析：视频滤镜介绍(下)

low、high：Canny边缘检测阈值，范围 [0,1]，默认最小值为20/255, 默认最大值为50/255 mode：绘制模式，默认为wire，所有模式如下所示： ‘wires’：黑色背景中绘制白灰连线 ‘colormix’：混合颜色，类似绘画卡通效果 ‘canny’：每个平面都进行Canny检测 planes：是否开启平面过滤，默认开启。duration：转场动画时长，范围为[0, 60]，默认为1 offset：转场动画相对第一个视频的偏移时间，单位为秒，默认为0。
复制链接

扫一扫