1. 从基础谈起
先给出几个概念,以在后面的分析中方便理解
Container:在音视频中的容器,一般指的是一种特定的文件格式,里面指明了所包含的
Stream:这个词有些微妙,很多地方都用到,比如TCP,SVR4系统等,其实在音视频,你
Frames:这个概念不是很好明确的表示,指的是Stream中的一个数据单元,要真正对这
Packet:是Stream的raw数据
Codec:Coded + Decoded
其实这些概念在在FFmpeg中都有很好的体现,我们在后续分析中会慢慢看到
2.解码的基本流程
我很懒,于是还是选择了从<An ffmpeg and SDLTutorial>中的流程概述:
10 OPEN video_stream FROMvideo.avi
20 READ packet FROM video_stream INTO frame
30 IF frame NOT COMPLETE GOTO 20
40 DO SOMETHING WITH frame
50 GOTO 20
这就是解码的全过程,一眼看去,是不是感觉不过如此:),不过,事情有深有浅,从浅
到深,然后从深回到浅可能才是一个有意思的过程,我们的故事,就从这里开始,展开
来讲。
3.例子代码
在<An ffmpeg and SDL Tutorial1>中,给出了一个阳春版的解码器,我们来仔细看看
阳春后面的故事,为了方便讲述,我先贴出代码:
#include<ffmpeg/avcodec.h>
#include <ffmpeg/avformat.h>
#include<stdio.h>
void SaveFrame(AVFrame *pFrame, intwidth, int height, int iFrame) {
FILE *pFile;
char szFilename[32];
int y;
// Open file
sprintf(szFilename, "frame%d.ppm", iFrame);
pFile=fopen(szFilename, "wb");
if(pFile==NULL)
// Write header
fprintf(pFile, "P6\n%d %d\n255\n", width, height);
// Write pixel data
for(y=0; y<height; y++)
// Close file
fclose(pFile);
}
int main(int argc, char *argv[]){
AVFormatContext *pFormatCtx;
int
AVCodecContext *pCodecCtx;
AVCodec
AVFrame
AVFrame
AVPacket
int
int
uint8_t
if(argc < 2) {
}
// Register all formats and codecs
########################################
[1]
########################################
av_register_all();
// Open video file
########################################
[2]
########################################
if(av_open_input_file(&pFormatCtx, argv[1], NULL,0, NULL)!=0)
// Retrieve stream information
########################################
[3]
########################################
if(av_find_stream_info(pFormatCtx)<0)
// Dump information about file onto standard error
dump_format(pFormatCtx, 0, argv[1], 0);
// Find the first video stream
videoStream=-1;
for(i=0; i<pFormatCtx->nb_streams;i++)
if(videoStream==-1)
// Get a pointer to the codec context for the videostream
pCodecCtx=pFormatCtx->streams[videoStream]->codec;
// Find the decoder for the video stream
pCodec=avcodec_find_decoder(pCodecCtx->codec_id);
if(pCodec==NULL) {
}
// Open codec
if(avcodec_open(pCodecCtx, pCodec)<0)
// Allocate video frame
pFrame=avcodec_alloc_frame();
// Allocate an AVFrame structure
pFrameRGB=avcodec_alloc_frame();
if(pFrameRGB==NULL)
// Determine required buffer size and allocate buffer
numBytes=avpicture_get_size(PIX_FMT_RGB24,pCodecCtx->width,
buffer=(uint8_t *)av_malloc(numBytes*sizeof(uint8_t));
// Assign appropriate parts of buffer to image planes inpFrameRGB
// Note that pFrameRGB is an AVFrame, but AVFrame is asuperset
// of AVPicture
avpicture_fill((AVPicture *)pFrameRGB, buffer,PIX_FMT_RGB24,
// Read frames and save first five frames to disk
########################################
[4]
########################################
i=0;
while(av_read_frame(pFormatCtx,&packet)>=0) {
}
// Free the RGB image
av_free(buffer);
av_free(pFrameRGB);
// Free the YUV frame
av_free(pFrame);
// Close the codec
avcodec_close(pCodecCtx);
// Close the video file
av_close_input_file(pFormatCtx);
return 0;
}
代码注释得很清楚,没什么过多需要讲解的,关于其中的什么YUV420,RGB,PPM等格式
,如果不理解,麻烦还是google一下,也可以参考:http://barrypopy.cublog.cn/里面
的相关文章
其实这部分代码,很好了Demo了怎么样去抓屏功能的实现,但我们得去看看魔术师在后
台的一些手法,而不只是简单的享受其表演。
4.背后的故事
真正的难度,其实就是上面的[1],[2],[3],[4],其他部分,都是数据结构之间的转换,
如果你认真看代码的话,不难理解其他部分。
[1]:没什么太多好说的,如果不明白,看我转载的关于FFmepg框架的文章
[2]:先说说里面的AVFormatContext*pFormatCtx结构,字面意思理解AVFormatContext
就是关于AVFormat(其实就是我们上面说的Container格式)的所处的Context(场景),自
然是保存Container信息的总控结构了,后面你也可以看到,基本上所有的信息,都可
以从它出发而获取到
我们来看看av_open_input_file()都做了些什么:
[libavformat/utils.c]
int av_open_input_file(AVFormatContext **ic_ptr, const char*filename,
{
}
这样看来,只是做了两件事情:
1). 侦测容器文件格式
2). 从容器文件获取Stream的信息
这两件事情,实际上就是调用特定文件的demuxer以分离Stream的过程:
具体流程如下:
av_open_input_file
如果反过来再参考我转贴的关于ffmpeg框架的文章,是否清楚一些了呢:)
[3]:简单从AVFormatContext获取Stream的信息,没什么好多说的
[4]:先简单说一些ffmpeg方面的东西,从理论角度说过来,Packet可以包含frame的部
分数据,但ffmpeg为了实现上的方便,使得对于视频来说,每个Packet至少包含一
frame,对于音频也是相应处理,这是实现方面的考虑,而非协议要求.
因此,在上面的代码实际上是这样的:
我们来看看如何获取Packet,又如何从Packet中解码frame的。
av_read_frame
avcodec_decode_video
因此,从上面的过程可以看到,实际上分为了两部分:
一部分是解复用(demuxer),然后是解码(decode)
使用的分别是:
av_open_input_file()
av_read_frame()
avcodec_decode_video()
5.后面该做些什么
结合这部分和转贴的ffmepg框架的文章,应该可以基本打通解码的流程了,后面的问题则是针对具体容器格式和具体编码解码器的分析,后面我们继续
[1]. <An ffmpeg and SDLTutorial>
[2]. <FFMpeg框架代码阅读>