FFMPEG编译使用以及FFMPEG在编码转换方面的应用

最新推荐文章于 2021-11-16 19:56:18 发布

_剪烛西窗_

最新推荐文章于 2021-11-16 19:56:18 发布

阅读量657

点赞数

分类专栏： C/C++编程 ffmpeg 文章标签： ffmpeg opencv

C/C++编程同时被 2 个专栏收录

18 篇文章 0 订阅

订阅专栏

ffmpeg

1 篇文章 0 订阅

订阅专栏

遇到一篇好文章，讲解了swscale库的使用详情。转载只是为了自己容易找到原文的位置，请各位同学到原文地址查看，谢谢。

转自：http://blackhuman.blogcn.com/archives/176

为了将YUV420编码转化成RGB444编码，并且可以保持很高的计算速度。我最终盯上了FFMPEG这个开源库。FFMPEG有很多功能，我为了解决上面提到的那个问题，只使用了sws_scale这一个函数。下面首先说一下这个函数的用法，然后在说下如何自己从源代码编译FFMPEG。

sws_scale函数的作用是图像缩放和图像空间编码转换，它包含在头文件<libswscale/swscale.h>中，由于是c函数，所以在c++编译器中调用时，需要使用extern "C" 来声明这个头文件，如下。
extern "C" {
#include <libswscale/swscale.h>
}
#pragma comment(lib,"swscale.lib")

sws_scale函数原型如下（下方图）。其中*context是一个指向SwsContext结构的指针，这个结构由sws_getContext函数生成，下面会提到。srcSlice应该指向源数据，我这里是指向一块YUV420编码数组的开头的。srcStride表示的是每个平面矩阵的行宽，比如YUV420编码分三个平面，Y平面、U平面和V平面。Y平面是一个W*H的矩阵（W是图像宽，H是图像高），所以Y平面行宽为W，即strStride[0]=W；U平面和V平面分别是一个(W/2)*(H/2)的矩阵（这是YUV420编码决定的），所以U和V平面的行宽为W/2，那么strStride[1]=W/2，strStride[2]=H/2；由于在YUV420下，第四个平面没有任何数据，所以strStride[3]=0。srcSliceY为0即可。srcSliceH为图像高度H。dst是一个指向目标数组的指针，这个数组将会存放转换后的RGB444数据，这个数据块需要事先分配好。dstStride表示目的数据格式中每个平面矩阵的行宽，由于RGB444需要交错通道排列，所以只需要一个平面，这样，这个平面的行宽就位W*3，即dstStride[0]=W*3,dstStride[1]=0,dstStride[2]=0,dstStride[3]=0。上面所有的数组都需要事先分配空间。下图为我的调用方法。
sws_scale函数原型
int sws_scale(
struct SwsContext *context,
const uint8_t* const srcSlice[],
const int srcStride[],
int srcSliceY,
int srcSliceH,
uint8_t* const dst[],
const int dstStride[]
);
我的调用方法
sws_scale(
img_convert_ctx,
Decdata,
srcStride,
0,
IMG_HEIGHT,
Encdata,
dstStride
);

下面说说那个swsContext结构体，这个结构体可由sws_getContext函数生成。sws_getContext函数原型如下（下图）。srcW为源数据图像宽，srcH为源数据图像高。srcFormat表示源数据图像格式，其中用PIX_FMT_YUV420P表示YUV420格式，还有其他表示方法，大家可以在FFMPEG对应头文件的声明中找到他们。dstW为目的数据图像宽，dstH为目的数据图像高。dstFormat表示目的数据图像格式，我需要RGB，所以用PIX_FMT_RGB24赋值。flags为SWS_BICUBIC即可，srcFilter,dstFilter,param为NULL即可。下图为我的调用方法。
sws_getContext函数原型
struct SwsContext *sws_getContext(
int srcW,
int srcH,
enum PixelFormat srcFormat,
int dstW,
int dstH,
enum PixelFormat dstFormat,
int flags,
SwsFilter *srcFilter,
SwsFilter *dstFilter,
const double *param
);
我的调用方法
SwsContext* img_convert_ctx = sws_getContext(
IMG_WIDTH,
IMG_HEIGHT,
PIX_FMT_YUV420P,
IMG_WIDTH,
IMG_HEIGHT,
(PixelFormat)PIX_FMT_RGB24,
SWS_BICUBIC,
NULL,
NULL,
NULL
);

这样，我就从Encdata中得到了RGB交错通道图像，这样，这个图像就可以放入OpenCV的IplImage结构中处理了。

下面再谈谈FFMPEG的编译。从FFMPEG项目主页（http://www.ffmpeg.org/releases/ffmpeg-0.6.3.tar.bz2）获得FFMPEG源码，并使用MinGW来进行编译。这里有必要说一下MinGW，我们可以把MinGW看成是一个编译环境，里面包含了一个叫做MSys的模拟器，MSys可以在windows中进行linux的类shell操作（像Cygwin）。反正目前编译FFMPEG只有这一种方法，照着做就行了。MinGW从其代码托管空间下载，但是一般下载的都是一个小文件，打开安装后会自动下载剩余部分。

经过漫长的等待后MinGW下载并安装好了，就可以使用了。运行.\MinGW32\MSYS\1.0\msys.bat进入控制台，在控制台中进入你FFMPEG源代码安装路径。接着就是标准的编译过程了。
$ ./configure --enable-memalign-hack --enable-static --enable-shared --enable-avfilter-lavf
$make
$make install

然后又是漫长的等待，成功之后，各种文件就会出现在.\MinGW\msys\1.0\local中了。

附上一些参考网站：

ffmpeg编译教程

http://www.cnblogs.com/Jerry-Chou/archive/2011/03/29/1998564.html

http://zhaostudy2.blog.163.com/blog/static/13535020520110179271153/

ffmpeg编译好的版本直接下载

http://www.ffmpeg.com.cn/index.php/%E9%A6%96%E9%A1%B5

YUV到RGB的转换方法

http://www.rosoo.net/a/201006/9661.html