ffmpeg开发指南(一) -- 中文版

最新推荐文章于 2020-09-16 19:18:36 发布

Tunix126

最新推荐文章于 2020-09-16 19:18:36 发布

阅读量4.9k

点赞数

分类专栏： C/C++ 文章标签： codec null video 存储 buffer 文档

C/C++ 专栏收录该内容

90 篇文章 0 订阅

订阅专栏

Ffmpeg 中的Libavformat 和 libavcodec库是访问大多数视频文件格式的一个很好的方法。不幸的是，在开发您自己的程序时，这套库基本上没有提供什么实际的文档可以用来作为参考（至少我没有找到任何文档），并且它的例程也并没有太多的帮助。这种情况意味着，当我在最近某个项目中需要用到 libavformat/libavcodec 库时，需要作很多试验来搞清楚怎样使用它们。这里是我所学习的－－希望我做的这些能够帮助一些人，以免他们重蹈我的覆辙，作同样的试验，遇到同样的错误。你还可以从这里下载一个demo程序。我将要公开的这部分代码需要0.4.8 版本的ffmpeg库中的 libavformat/libavcodec 的支持（我正在写最新版本）。如果您发现以后的版本与我写的程序不能兼容，请告知我。在这个文档里，我仅仅涉及到如何从文件中读入视频流；音频流使用几乎同样的方法可以工作的很好，不过，我并没有实际使用过它们，所以，我没于办法提供任何示例代码。或许您会觉得奇怪，为什么需要两个库文件 libavformat 和 libavcodec ：许多视频文件格式（AVI就是一个最好的例子）实际上并没有明确指出应该使用哪种编码来解析音频和视频数据；它们只是定义了音频流和视频流（或者，有可能是多个音频视频流）如何被绑定在一个文件里面。这就是为什么有时候，当你打开了一个AVI文件时，你只能听到声音，却不能看到图象－－因为你的系统没有安装合适的视频解码器。所以， libavformat 用来处理解析视频文件并将包含在其中的流分离出来，而libavcodec 则处理原始音频和视频流的解码。打开视频文件：首先第一件事情－－让我们来看看怎样打开一个视频文件并从中得到流。我们要做的第一件事情就是初始化libavformat/libavcodec: av_register_all(); 这一步注册库中含有的所有可用的文件格式和编码器，这样当打开一个文件时，它们才能够自动选择相应的文件格式和编码器。要注意你只需调用一次av_register_all()，所以，尽可能的在你的初始代码中使用它。如果你愿意，你可以仅仅注册个人的文件格式和编码，不过，通常你不得不这么做却没有什么原因。下一步，打开文件： AVFormatContext *pFormatCtx; const char *filename="myvideo.mpg"; // 打开视频文件 if(av_open_input_file(&pFormatCtx, filename, NULL, 0, NULL)!=0) handle_error(); // 不能打开此文件最后三个参数描述了文件格式，缓冲区大小（size）和格式参数；我们通过简单地指明NULL或0告诉 libavformat 去自动探测文件格式并且使用默认的缓冲区大小。请在你的程序中用合适的出错处理函数替换掉handle_error()。下一步，我们需要取出包含在文件中的流信息： // 取出流信息 if(av_find_stream_info(pFormatCtx)<0) handle_error(); // 不能够找到流信息这一步会用有效的信息把 AVFormatContext 的流域（streams field）填满。作为一个可调试的诊断，我们会将这些信息全盘输出到标准错误输出中，不过你在一个应用程序的产品中并不用这么做： dump_format(pFormatCtx, 0, filename, false); 就像在引言中提到的那样，我们仅仅处理视频流，而不是音频流。为了让这件事情更容易理解，我们只简单使用我们发现的第一种视频流： int i, videoStream; AVCodecContext *pCodecCtx; // 寻找第一个视频流 videoStream=-1; for(i=0; i<pFormatCtx->nb_streams; i++) if(pFormatCtx->streams->codec.codec_type==CODEC_TYPE_VIDEO) { videoStream=i; break; } if(videoStream==-1) handle_error(); // Didn't find a video stream // 得到视频流编码上下文的指针 pCodecCtx=&pFormatCtx->streams[videoStream]->codec; 好了，我们已经得到了一个指向视频流的称之为上下文的指针。但是我们仍然需要找到真正的编码器打开它。 AVCodec *pCodec; // 寻找视频流的解码器 pCodec=avcodec_find_decoder(pCodecCtx->codec_id); if(pCodec==NULL) handle_error(); // 找不到解码器 // 通知解码器我们能够处理截断的bit流－－ie， // bit流帧边界可以在包中 if(pCodec->capabilities & CODEC_CAP_TRUNCATED) pCodecCtx->flags|=CODEC_FLAG_TRUNCATED; // 打开解码器 if(avcodec_open(pCodecCtx, pCodec)<0) handle_error(); // 打不开解码器（那么什么是“截断bit流”？好的，就像一会我们看到的，视频流中的数据是被分割放入包中的。因为每个视频帧的数据的大小是可变的，那么两帧之间的边界就不一定刚好是包的边界。这里，我们告知解码器我们可以处理bit流。）存储在 AVCodecContext结构中的一个重要的信息就是视频帧速率。为了允许非整数的帧速率（比如 NTSC的 29.97帧），速率以分数的形式存储，分子在 pCodecCtx->frame_rate，分母在 pCodecCtx->frame_rate_base 中。在用不同的视频文件测试库时，我注意到一些编码器（很显然ASF）似乎并不能正确的给予赋值（ frame_rate_base 用1代替1000）。下面给出修复补丁： // 加入这句话来纠正某些编码器产生的帧速错误 if(pCodecCtx->frame_rate>1000 && pCodecCtx->frame_rate_base==1) pCodecCtx->frame_rate_base=1000; 注意即使将来这个bug解决了，留下这几句话也并没有什么坏处。视频不可能拥有超过1000fps的帧速。只剩下一件事情要做了：给视频帧分配空间以便存储解码后的图片： AVFrame *pFrame; pFrame=avcodec_alloc_frame(); 就这样，现在我们开始解码这些视频。解码视频帧就像我前面提到过的，视频文件包含数个音频和视频流，并且他们各个独自被分开存储在固定大小的包里。我们要做的就是使用libavformat依次读取这些包，过滤掉所有那些视频流中我们不感兴趣的部分，并把它们交给 libavcodec 进行解码处理。在做这件事情时，我们要注意这样一个事实，两帧之间的边界也可以在包的中间部分。听起来很复杂？幸运的是，我们在一个例程中封装了整个过程，它仅仅返回下一帧： bool GetNextFrame(AVFormatContext *pFormatCtx, AVCodecContext *pCodecCtx, int videoStream, AVFrame *pFrame) { static AVPacket packet; static int bytesRemaining=0; static uint8_t *rawData; static bool fFirstTime=true; Int bytesDecoded; Int frameFinished; // 我们第一次调用时，将 packet.data 设置为NULL指明它不用释放了 if(fFirstTime) { fFirstTime=false; packet.data=NULL; } // 解码直到成功解码完整的一帧 while(true) { // 除非解码完毕，否则一直在当前包中工作 while(bytesRemaining > 0) { // 解码下一块数据 bytesDecoded=avcodec_decode_video(pCodecCtx, pFrame, &frameFinished, rawData, bytesRemaining); // 出错了？ if(bytesDecoded < 0) { fprintf(stderr, "Error while decoding frame/n"); return false; } bytesRemaining-=bytesDecoded; rawData+=bytesDecoded; // 我们完成当前帧了吗？接着我们返回 if(frameFinished) return true; } // 读取下一包，跳过所有不属于这个流的包 do { // 释放旧的包 if(packet.data!=NULL) av_free_packet(&packet); // 读取新的包 if(av_read_packet(pFormatCtx, &packet)<0) goto loop_exit; } while(packet.stream_index!=videoStream); bytesRemaining=packet.size; rawData=packet.data; } loop_exit: // 解码最后一帧的余下部分 bytesDecoded=avcodec_decode_video(pCodecCtx, pFrame, &frameFinished, rawData, bytesRemaining); // 释放最后一个包 if(packet.data!=NULL) av_free_packet(&packet); return frameFinished!=0; } 现在，我们要做的就是在一个循环中，调用 GetNextFrame () 直到它返回false。还有一处需要注意：大多数编码器返回 YUV 420 格式的图片（一个亮度和两个色度通道，色度通道只占亮度通道空间分辨率的一半（译者注：此句原句为the chrominance channels samples at half the spatial resolution of the luminance channel））。看你打算如何对视频数据处理，或许你打算将它转换至RGB格式。（注意，尽管，如果你只是打算显示视频数据，那大可不必要这么做；查看一下 X11 的 Xvideo 扩展，它可以在硬件层进行 YUV到RGB 转换。）幸运的是， libavcodec 提供给我们了一个转换例程 img_convert ，它可以像转换其他图象进行 YUV 和 RGB之间的转换。这样解码视频的循环就变成这样： while(GetNextFrame(pFormatCtx, pCodecCtx, videoStream, pFrame)) { img_convert((AVPicture *)pFrameRGB, PIX_FMT_RGB24, (AVPicture*)pFrame, pCodecCtx->pix_fmt, pCodecCtx->width, pCodecCtx->height); // 处理视频帧（存盘等等） DoSomethingWithTheImage(pFrameRGB); } RGB图象pFrameRGB （AVFrame *类型）的空间分配如下： AVFrame *pFrameRGB; int numBytes; uint8_t *buffer; // 分配一个AVFrame 结构的空间 pFrameRGB=avcodec_alloc_frame(); if(pFrameRGB==NULL) handle_error(); // 确认所需缓冲区大小并且分配缓冲区空间 numBytes=avpicture_get_size(PIX_FMT_RGB24, pCodecCtx->width, pCodecCtx->height); buffer=new uint8_t[numBytes]; // 在pFrameRGB中给图象位面赋予合适的缓冲区 avpicture_fill((AVPicture *)pFrameRGB, buffer, PIX_FMT_RGB24, pCodecCtx->width, pCodecCtx->height); 清除好了，我们已经处理了我们的视频，现在需要做的就是清除我们自己的东西： // 释放 RGB 图象 delete [] buffer; av_free(pFrameRGB); // 释放YUV 帧 av_free(pFrame); // 关闭解码器（codec） avcodec_close(pCodecCtx); // 关闭视频文件 av_close_input_file(pFormatCtx); 完成！

Tunix126

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
2
评论
ffmpeg开发指南(一) -- 中文版

Ffmpeg 中的Libavformat 和 libavcodec库是访问大多数视频文件格式的一个很好的方法。不幸的是，在开发您自己的程序时，这套库基本上没有提供什么实际的文档可以用来作为参考（至少我没有找到任何文档），并且它的例程也并没有太多的帮助。这种情况意味着，当我在最近某个项目中需要用到 libavformat/libavcodec 库时，需要作很多试验来搞清楚怎样使用它们。这里是
复制链接

扫一扫