ffmpeg的mpeg2编码I帧代码解读

 

ffmpeg的mpeg2编码I帧代码解读

首先说一下编码的函数层次:
MPV_encode_picture
—encode_thread
———encode_mb_hq
————encode_mb(编码一个宏块)
——————encode_mb_internal(编码I帧宏块,在这个函数里面选择不同的宏块编码器)
————————mpeg1_encode_mb(由于YUV的比例不一样,4:4:4或者4:2:0,进行宏块编码)
——————————mpeg1_encode_mb_internal(对宏块进行编码)
————————————mpeg1_encode_block(对一个block进行编码,注意这里面的宏块都是经过DCT和量化之后的数据):这个函数就是最需要看的咯:包括DC编码和AC编码,会选择不同的码表进行编码(详细过程看代码)

其次,所有的编码后的数据都是通过函数put_bits写到比特流中

第三,以上的代码解读都不包括诸如图片头之类的编码,相应的格式编码可以在相应层次中的函数里面找到。

第 四,libavcodec/mpegvideo_enc.c里面MPV_encode_init对编码进行初始化,主要是初始化,根据 avctx->codec_id选择不同的编码标准,进行不同的初始化,在656行,根据s->dct_quantize选择了DCT系数和 量化器(因为不同的编码标准,量化器是不一样的),然而在程序里面,统一由函数指针指向的函数dct_quantize完成

第五,在encode_mb_internal里面首先,进行了DCT和量化,然后进行霍夫曼编码——根据(s->codec_id)选择不同的编码器。DCT & quantize在1629行。

第五,在 mpeg1_encode_block函数里面的block并没有进行zig-zag扫描,而 zig-zag扫描的过程,是在不断的产生新的索引index,这个步骤是在885行的j = s->intra_scantable.permutated[i];完成的,j就是zig-zag扫描之后的索引,根据j索引出block中的数据。

简单的说一下编码的过程:
1.初始化,包括选择DCT和量化器等等
2.编码一个图像(picture),将picture分成若干的mb(MacroBlock),这个时候要写入相应的图片头信息
3. 编码I帧MacroBlock,将MacroBlock分成若个小的block,由于YUV的比例不一样,因此每次需要编码的block的数量也是不一样 的,在函数mpeg1_encode_mb里面,就区分了CHROMA_420和其他格式拥有不同的block数量。
4.编码block,一个block包含三个编码对象:DC系数,AC系数(level)和游程长度。DC系数单独用差分编码,AC和run
联合在一起编码。这个过程都是在函数mpeg1_encode_block里面完成的。
 
1.MpegEncContext这个struct类型,一定要吃透,虽然代码是用C写得,但是写得很C++,这个MpegEncContext其实可以看做一个C++的类,里面定义了很多指针,这些指针指又指向了一些strcut,而这个struct其实相当于C++的成员函数,成员函数的初始化,一般是在XX_init函数里面初始化的。这一点,可以在后面的叙述中体现出来。

2.再说一下编码的过程,encode_mb_internal函数,做了MarcoBlock的编码,在1629行,开始做DCT&quant,1686行,开始做霍夫曼编码,而霍夫曼编码,对不同的标准来说,码表是不一样的,因此在1687行做了一个switch的选择,mpeg1和mpeg2,都是用的相同的mpeg1_encode_mb函数进行block的编码,而block内的编码,在以前的笔记中已经提到,过程这里不重复。

3.现在说DCT&quant,其中,1635行s->block_last_index[i] = s->dct_quantize(s, s->block[i], i, s->qscale, &overflow);,就是做DCT&quant。正如第1点中说的,dct_quantize本来只是MpegEncContext中的一个元素,类型为指针,指向一个struct,而这个struct就相当于C++里面的成员函数。现在,我们知道了在这个地方,相当于调用了一个成员函数,做了DCT&quant这件事情,接下来,讨论这个成员函数在哪里初始化的。

4.在Mpegvideo.c的MPV_encode_init函数里面,对编码所需要的一些“成员函数”进行了初始化。前面一堆东西,是做编码器的选择。在第656行,dct_quant这成员函数被初始化为dct_quant_c这个函数。于是,接下去找dct_quant_c这个函数的定义。发现,3649行,又调用了dsp.fdct这个成员函数,做离散余弦变换。接下来找dsp.fdct这个成员函数的初始化地方。
这个非常费劲,我找了半天才找到——在函数dsputil_init里面做了fdct的初始化,一步一步的跟踪调用关系,可以发现过程是这样的:
MPV_encode_init调用MPV_common_init,再调用dsputil_init,在dsputil_init里面初始化了fdct,而MPV_encode_init紧接着,执行前面提到的dct_quantize的初始化。
至此,整个初始化完成。
 
1.完整的初始化过程,函数调用关系如下:
    encode_init
    MPV_encode_init:里面要根据不同的Codec_ID来配置一些数据
    MPV_common_init:基本的结构体的初始化,在此之前,高度宽度等变量已经设置好了
   dsputil_init 初始化了fdct 而MPV_encode_init紧接着,执行前面提到的dct_quantize的初始化。
然而,这个时候量化表并没有初始化,量化表的初始化是用函数ff_set_qscale进行的。而这个函数的调用关系,在第二点中讲到
 
2.编码器运行的函数调用关系如下:
    MPV_encode_picture:顶层函数
    encode_picture:编码一副图像,这个时候首先要编码图像头,调用mpeg1_encode_picture_header函数,然后在2912行,通过s指针调用了encode_thread函数,开始编码
    encode_thread里面,调用了ff_set_qscale,进行qscale的初始化,然后调用encode_mb_hq进行编码
    encode_mb_hq调用encode_mb进行宏块编码
    encode_mb调用encode_mb_internal进行帧内编码
    encode_mb_internal调用mpeg1_encode_mb进行编码
    mpeg1_encode_mb调用mpeg1_encode_mb_internal进行编码
    mpeg1_encode_mb_internal调用mpeg1_encode_block进行16x16的块编码
 
3.关于header
    mpeg1_encode_picture_header调用了mpeg1_encode_sequence_header写入了序列的头
    mpeg1_encode_sequence_header调用了ff_write_quant_matrix这里面,包括了要填的量化表的写入,这个量化表是用户自定义的。在后面又调用了ff_mpeg1_encode_slice_header。
    ff_mpeg1_encode_slice_header又调用了写header,写qscale的函数,写文件头。
 
 
下面解释一个block的编码以及编码码表
 
1.首先编码的是DC系数,在函数 encode_dc里面进行。由于DC系数的码表有两个,分别针对Y帧和(Cr,Cb)帧。编码的时候,编码的是非负的系数,但是原始的DC系数有正有负,因此需要做一个映射。这一个映射,在encode_dc里面,首先就用
if(((unsigned) (diff+255)) >= 511)
分成了两部分,表示正负数的映射。而码表的选择,是根据component变量来选择的。整个编码过程和标准完全一样。但是代码中diff为正和为负的情况,表面上采用了不同的编码方法,但是实质上是完全一样的。
mpeg1_lum_dc_uni的初始化在 ff_mpeg1_encode_init里面完成,查看这个初始化过程,其实就是一个编码过程。
 
2.对于其他系数的编码,根据标准,存在两种不同的情况:
a.(level,run)较小的情况,直接进行查表
b.(level,run)较大的情况,进行所谓的换码编码,首先是写入一个Escape code,然后在加上level和run
因此,首先需要判断(level,run)是否足够大,代码中用
if (alevel <= mpeg1_max_level[0][run])
来解决这个问题。 mpeg1_max_level这个矩阵的构成在 ff_mpeg1_encode_init函数中,通过调用init_rl函数来实现,至于这个具体怎么初始化的,很容易看懂的(如果这个都看不懂,那ffmpeg代码也就不要想看懂了)
 
3.在一个block的最后,需要编码end of block,也是通过查表
 
4.现在解释码表,所有要用到的vlc的码表存放在文件mpeg12data.c里面,
mpeg1_vlc就是标准中的码表B-14
mpeg2_vlc就是标准中的码表B-15
两个码表,第一列表示码字,第二列表示码字长度,对照标准上面的码表,很容易发现这两个数组的构成方法(具体是什么,看一下就知道了,很容易的)
看懂了这里,也就很容易看懂在mpeg12enc.c里面对于其他系数的编码了
 
最后要说的是,ffmpeg的代码写的非常的晦涩,写得非常的不对称,比如encode_dc就是这样的,码表的初始化也比较混乱,因而看起来很费劲
 
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值