ffmpeg的mpeg2编码I帧代码解读

最新推荐文章于 2024-04-17 06:22:16 发布

武爱敏

最新推荐文章于 2024-04-17 06:22:16 发布

阅读量3.1k

点赞数

分类专栏：视频编解码文章标签： header struct thread codec matrix c

视频编解码专栏收录该内容

62 篇文章 21 订阅

订阅专栏

ffmpeg的mpeg2编码I帧代码解读

首先说一下编码的函数层次：
MPV_encode_picture
—encode_thread
———encode_mb_hq
————encode_mb（编码一个宏块）
——————encode_mb_internal（编码I帧宏块，在这个函数里面选择不同的宏块编码器）
————————mpeg1_encode_mb（由于YUV的比例不一样，4：4：4或者4：2：0，进行宏块编码）
——————————mpeg1_encode_mb_internal（对宏块进行编码）
————————————mpeg1_encode_block（对一个block进行编码，注意这里面的宏块都是经过DCT和量化之后的数据）：这个函数就是最需要看的咯：包括DC编码和AC编码，会选择不同的码表进行编码（详细过程看代码）

其次，所有的编码后的数据都是通过函数put_bits写到比特流中

第三，以上的代码解读都不包括诸如图片头之类的编码，相应的格式编码可以在相应层次中的函数里面找到。

第四，libavcodec/mpegvideo_enc.c里面MPV_encode_init对编码进行初始化，主要是初始化，根据 avctx->codec_id选择不同的编码标准，进行不同的初始化，在656行，根据s->dct_quantize选择了DCT系数和量化器（因为不同的编码标准，量化器是不一样的），然而在程序里面，统一由函数指针指向的函数dct_quantize完成

第五，在encode_mb_internal里面首先，进行了DCT和量化，然后进行霍夫曼编码——根据(s->codec_id)选择不同的编码器。DCT & quantize在1629行。

第五，在 mpeg1_encode_block函数里面的block并没有进行zig-zag扫描，而 zig-zag扫描的过程，是在不断的产生新的索引index，这个步骤是在885行的j = s->intra_scantable.permutated[i];完成的，j就是zig-zag扫描之后的索引，根据j索引出block中的数据。

简单的说一下编码的过程：
1.初始化，包括选择DCT和量化器等等
2.编码一个图像（picture），将picture分成若干的mb（MacroBlock），这个时候要写入相应的图片头信息
3. 编码I帧MacroBlock，将MacroBlock分成若个小的block，由于YUV的比例不一样，因此每次需要编码的block的数量也是不一样的，在函数mpeg1_encode_mb里面，就区分了CHROMA_420和其他格式拥有不同的block数量。
4.编码block，一个block包含三个编码对象：DC系数，AC系数（level）和游程长度。DC系数单独用差分编码，AC和run
联合在一起编码。这个过程都是在函数mpeg1_encode_block里面完成的。

1.MpegEncContext这个struct类型，一定要吃透，虽然代码是用C写得，但是写得很C++，这个MpegEncContext其实可以看做一个C++的类，里面定义了很多指针，这些指针指又指向了一些strcut，而这个struct其实相当于C++的成员函数，成员函数的初始化，一般是在XX_init函数里面初始化的。这一点，可以在后面的叙述中体现出来。

2.再说一下编码的过程，encode_mb_internal函数，做了MarcoBlock的编码，在1629行，开始做DCT&quant，1686行，开始做霍夫曼编码，而霍夫曼编码，对不同的标准来说，码表是不一样的，因此在1687行做了一个switch的选择，mpeg1和mpeg2，都是用的相同的mpeg1_encode_mb函数进行block的编码，而block内的编码，在以前的笔记中已经提到，过程这里不重复。

3.现在说DCT&quant，其中，1635行s->block_last_index[i] = s->dct_quantize(s, s->block[i], i, s->qscale, &overflow);，就是做DCT&quant。正如第1点中说的，dct_quantize本来只是MpegEncContext中的一个元素，类型为指针，指向一个struct，而这个struct就相当于C++里面的成员函数。现在，我们知道了在这个地方，相当于调用了一个成员函数，做了DCT&quant这件事情，接下来，讨论这个成员函数在哪里初始化的。

4.在Mpegvideo.c的MPV_encode_init函数里面，对编码所需要的一些“成员函数”进行了初始化。前面一堆东西，是做编码器的选择。在第656行，dct_quant这成员函数被初始化为dct_quant_c这个函数。于是，接下去找dct_quant_c这个函数的定义。发现，3649行，又调用了dsp.fdct这个成员函数，做离散余弦变换。接下来找dsp.fdct这个成员函数的初始化地方。
这个非常费劲，我找了半天才找到——在函数dsputil_init里面做了fdct的初始化，一步一步的跟踪调用关系，可以发现过程是这样的：
MPV_encode_init调用MPV_common_init，再调用dsputil_init，在dsputil_init里面初始化了fdct，而MPV_encode_init紧接着，执行前面提到的dct_quantize的初始化。
至此，整个初始化完成。

1.完整的初始化过程，函数调用关系如下：

encode_init

MPV_encode_init：里面要根据不同的Codec_ID来配置一些数据

MPV_common_init：基本的结构体的初始化，在此之前，高度宽度等变量已经设置好了

dsputil_init ：初始化了fdct ，而MPV_encode_init紧接着，执行前面提到的dct_quantize的初始化。

然而，这个时候量化表并没有初始化，量化表的初始化是用函数ff_set_qscale进行的。而这个函数的调用关系，在第二点中讲到

2.编码器运行的函数调用关系如下：

MPV_encode_picture：顶层函数

encode_picture：编码一副图像，这个时候首先要编码图像头，调用mpeg1_encode_picture_header函数，然后在2912行，通过s指针调用了encode_thread函数，开始编码

encode_thread里面，调用了ff_set_qscale，进行qscale的初始化，然后调用encode_mb_hq进行编码

encode_mb_hq调用encode_mb进行宏块编码

encode_mb调用encode_mb_internal进行帧内编码

encode_mb_internal调用mpeg1_encode_mb进行编码

mpeg1_encode_mb调用mpeg1_encode_mb_internal进行编码

mpeg1_encode_mb_internal调用mpeg1_encode_block进行16x16的块编码

3.关于header

mpeg1_encode_picture_header调用了mpeg1_encode_sequence_header写入了序列的头

mpeg1_encode_sequence_header调用了ff_write_quant_matrix这里面，包括了要填的量化表的写入，这个量化表是用户自定义的。在后面又调用了ff_mpeg1_encode_slice_header。

ff_mpeg1_encode_slice_header又调用了写header，写qscale的函数，写文件头。

下面解释一个block的编码以及编码码表

1.首先编码的是DC系数，在函数 encode_dc里面进行。由于DC系数的码表有两个，分别针对Y帧和（Cr，Cb）帧。编码的时候，编码的是非负的系数，但是原始的DC系数有正有负，因此需要做一个映射。这一个映射，在encode_dc里面，首先就用

if(((unsigned) (diff+255)) >= 511)

分成了两部分，表示正负数的映射。而码表的选择，是根据component变量来选择的。整个编码过程和标准完全一样。但是代码中diff为正和为负的情况，表面上采用了不同的编码方法，但是实质上是完全一样的。

mpeg1_lum_dc_uni的初始化在 ff_mpeg1_encode_init里面完成，查看这个初始化过程，其实就是一个编码过程。

2.对于其他系数的编码，根据标准，存在两种不同的情况：

a.（level，run）较小的情况，直接进行查表

b.（level，run）较大的情况，进行所谓的换码编码，首先是写入一个Escape code，然后在加上level和run

因此，首先需要判断（level，run）是否足够大，代码中用

if (alevel <= mpeg1_max_level[0][run])

来解决这个问题。 mpeg1_max_level这个矩阵的构成在 ff_mpeg1_encode_init函数中，通过调用init_rl函数来实现，至于这个具体怎么初始化的，很容易看懂的（如果这个都看不懂，那ffmpeg代码也就不要想看懂了）

3.在一个block的最后，需要编码end of block，也是通过查表

4.现在解释码表，所有要用到的vlc的码表存放在文件mpeg12data.c里面，

mpeg1_vlc就是标准中的码表B-14

mpeg2_vlc就是标准中的码表B-15

两个码表，第一列表示码字，第二列表示码字长度，对照标准上面的码表，很容易发现这两个数组的构成方法（具体是什么，看一下就知道了，很容易的）

看懂了这里，也就很容易看懂在mpeg12enc.c里面对于其他系数的编码了

最后要说的是，ffmpeg的代码写的非常的晦涩，写得非常的不对称，比如encode_dc就是这样的，码表的初始化也比较混乱，因而看起来很费劲

武爱敏

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
ffmpeg的mpeg2编码I帧代码解读

ffmpeg的mpeg2编码I帧代码解读<!--body {font-family:Tahoma; font-size:10pt}p {font-family:Tahoma; font-size:10pt}div {font-fam
复制链接

扫一扫

专栏目录