FFMPEG编译使用以及FFMPEG在编码转换方面的应用

遇到一篇好文章,讲解了swscale库的使用详情。转载只是为了自己容易找到原文的位置,请各位同学到原文地址查看,谢谢。

转自:http://blackhuman.blogcn.com/archives/176


为了将YUV420编码转化成RGB444编码,并且可以保持很高的计算速度。我最终盯上了FFMPEG这个开源库。FFMPEG有很多功能,我为了解决上面提到的那个问题,只使用了sws_scale这一个函数。下面首先说一下这个函数的用法,然后在说下如何自己从源代码编译FFMPEG。


sws_scale函数的作用是图像缩放和图像空间编码转换,它包含在头文件<libswscale/swscale.h>中,由于是c函数,所以在c++编译器中调用时,需要使用extern "C" 来声明这个头文件,如下。
extern "C" {
#include <libswscale/swscale.h>
}
#pragma comment(lib,"swscale.lib")

sws_scale函数原型如下(下方图)。其中*context是一个指向SwsContext结构的指针,这个结构由sws_getContext函数生成,下面会提到。srcSlice应该指向源数据,我这里是指向一块YUV420编码数组的开头的。srcStride表示的是每个平面矩阵的行宽,比如YUV420编码分三个平面,Y平面、U平面和V平面。Y平面是一个W*H的矩阵(W是图像宽,H是图像高),所以Y平面行宽为W,即strStride[0]=W;U平面和V平面分别是一个(W/2)*(H/2)的矩阵(这是YUV420编码决定的),所以U和V平面的行宽为W/2,那么strStride[1]=W/2,strStride[2]=H/2;由于在YUV420下,第四个平面没有任何数据,所以strStride[3]=0。srcSliceY为0即可。srcSliceH为图像高度H。dst是一个指向目标数组的指针,这个数组将会存放转换后的RGB444数据,这个数据块需要事先分配好。dstStride表示目的数据格式中每个平面矩阵的行宽,由于RGB444需要交错通道排列,所以只需要一个平面,这样,这个平面的行宽就位W*3,即dstStride[0]=W*3,dstStride[1]=0,dstStride[2]=0,dstStride[3]=0。上面所有的数组都需要事先分配空间。下图为我的调用方法。
sws_scale函数原型
int sws_scale(
struct SwsContext *context,
const uint8_t* const srcSlice[],
const int srcStride[],
int srcSliceY,
int srcSliceH,
uint8_t* const dst[],
const int dstStride[]
);
我的调用方法
sws_scale(
img_convert_ctx,
Decdata,
srcStride,
0,
IMG_HEIGHT,
Encdata,
dstStride
);

下面说说那个swsContext结构体,这个结构体可由sws_getContext函数生成。sws_getContext函数原型如下(下图)。srcW为源数据图像宽,srcH为源数据图像高。srcFormat表示源数据图像格式,其中用PIX_FMT_YUV420P表示YUV420格式,还有其他表示方法,大家可以在FFMPEG对应头文件的声明中找到他们。dstW为目的数据图像宽,dstH为目的数据图像高。dstFormat表示目的数据图像格式,我需要RGB,所以用PIX_FMT_RGB24赋值。flags为SWS_BICUBIC即可,srcFilter,dstFilter,param为NULL即可。下图为我的调用方法。
sws_getContext函数原型
struct SwsContext *sws_getContext(
int srcW,
int srcH,
enum PixelFormat srcFormat,
int dstW,
int dstH,
enum PixelFormat dstFormat,
int flags,
SwsFilter *srcFilter,
SwsFilter *dstFilter,
const double *param
);
我的调用方法
SwsContext* img_convert_ctx = sws_getContext(
IMG_WIDTH,
IMG_HEIGHT,
PIX_FMT_YUV420P,
IMG_WIDTH,
IMG_HEIGHT,
(PixelFormat)PIX_FMT_RGB24,
SWS_BICUBIC,
NULL,
NULL,
NULL
);

这样,我就从Encdata中得到了RGB交错通道图像,这样,这个图像就可以放入OpenCV的IplImage结构中处理了。

下面再谈谈FFMPEG的编译。从FFMPEG项目主页(http://www.ffmpeg.org/releases/ffmpeg-0.6.3.tar.bz2)获得FFMPEG源码,并使用MinGW来进行编译。这里有必要说一下MinGW,我们可以把MinGW看成是一个编译环境,里面包含了一个叫做MSys的模拟器,MSys可以在windows中进行linux的类shell操作(像Cygwin)。反正目前编译FFMPEG只有这一种方法,照着做就行了。MinGW从其代码托管空间下载,但是一般下载的都是一个小文件,打开安装后会自动下载剩余部分。

经过漫长的等待后MinGW下载并安装好了,就可以使用了。运行.\MinGW32\MSYS\1.0\msys.bat进入控制台,在控制台中进入你FFMPEG源代码安装路径。接着就是标准的编译过程了。
$ ./configure --enable-memalign-hack --enable-static --enable-shared --enable-avfilter-lavf
$make
$make install


然后又是漫长的等待,成功之后,各种文件就会出现在.\MinGW\msys\1.0\local中了。

附上一些参考网站:

ffmpeg编译教程

http://www.cnblogs.com/Jerry-Chou/archive/2011/03/29/1998564.html

http://zhaostudy2.blog.163.com/blog/static/13535020520110179271153/

ffmpeg编译好的版本直接下载

http://www.ffmpeg.com.cn/index.php/%E9%A6%96%E9%A1%B5

YUV到RGB的转换方法

http://www.rosoo.net/a/201006/9661.html
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
敬告:本课程基于最新版FFmpeg4.3.1开发,仅供学习参考,不可以直接商用(想直接购买商用源代码的同学,请放弃!)。我将带领大家从以下几个方面来深入剖析ffmpeg4.3:“拿来主义”、“为我所用”。通过学习本课程,您将收获:三大多媒体框架(DirectShow、GStreamer、FFmpeg)简介与分析FFmpeg4.3的开发环境搭建(重要讲解windows下的源码编译及vs2015的环境)ffmpeg.c(4.3.1)源码剖析(分析开源大师们的设计理念和编码技巧)亲手封装私有函数:获取音视频流信息(类似于MediaInfo)、获取实时转码进度(改善用户体验)两套实现代码: MFC和Qt。-------------------------------------------------------------------音视频是一门很复杂的技术,涉及的概念、原理、理论非常多,很多初学者不学 基础理论,而是直接做项目,往往会看到c/c++的代码时一头雾水,不知道代码到底是什么意思,这是为什么呢? 因为没有学习音视频的基础理论,就比如学习英语,不学习基本单词,而是天天听英语新闻,总也听不懂。所以呢,一定要认真学习基础理论,然后再学习播放器、转码器、非编、流媒体直播、视频监控、等等。 梅老师从事音视频与流媒体行业18年;曾在永新视博、中科大洋、百度、美国Harris广播事业部等公司就职,经验丰富;曾亲手主导广电直播全套项目,精通h.264/h.265/aac,曾亲自参与百度app上的网页播放器等实战产品。目前全身心自主创业,主要聚焦音视频+流媒体行业,精通音视频加密、流媒体在线转码快编等热门产品。  
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值