WishMaster

1+1.巴赫.酸菜鱼

转载 调用Xvid编码器流程(基于xvid1.1.0)收藏

新一篇: 动手制作baby linux | 旧一篇: 针对FFMPEG0.49版本API编写的简单解码程序

xvid有两种编码方式:single pass和twopass
  single pass模式编码简单,速度也快,但最终效果不如twopass。
  twopass就是视频压制需要经过两次编码,分别为twopass-1st pass(简称1pass)和twopass-2nd pass(简称2pass)
  1pass时,编码器会用最高质量编码采集可供第2次运算参考的画面信息,而在2 pass时。编码器会根据第一次压缩获得的信息和用户指定的文件大小,自动分配比特率,使需要高流量的运动画面分配到更多的空间,更高的比特率来保证画面质量。相对的,对于那些不包含太多运动信息的静态画面则用较低的比特率。追求画质的朋友当然会选择这种方式,但运算比single pass更费时。

接下来介绍一些基本概念:
  Q值——量化值,它被用来描述1帧的质量,每帧都有一个Q值,取值范围在1-31之间。Q值越小,画质越好,比特率越大
  I-frame——关键帧,常被缩写为IF。关键帧是构成一个帧组的第一帧。IF保留了一个场景的所有信息
  P-frame——未来单项预测帧,缩写为PF,只储存与之前一个已解压画面的差值
  B-frame——双向预测帧,缩写为BF,除了参考之前解压的画面以外,也会参考后一帧的画面信息

 

编码流程:

 

   各变量的设置:创建xvid_enc_frame_txvid_enc_stats_t,分别用于传入参数和统计编码结果。

具体过程:

设置传入图像数据和图像色彩空间

设置传出的码流

设置vol的标志

设置帧的编码类型

设置量化因子

设置运动估计算法集合

设置vop的标志

Image

编码器提供的函数

1,  xvid_global(NULL, XVID_GBL_INIT, &xvid_gbl_init, NULL);

含义:根据cpu的特性使用相应汇编优化的函数

 

2,  xvid_encore(NULL, XVID_ENC_CREATE, &xvid_enc_create, NULL);

含义:初始化编码器。

具体过程:

创建编码器句柄,并根据传入的参数设置各变量的值,并且分配要使用的内存,用于存放重建帧,参考帧(1/2像素精度)。以及各种临时变量。并且做好码率控制的初始化。

 

3,  xvid_encore(enc_handle, XVID_ENC_ENCODE, &xvid_enc_frame, &xvid_enc_stats);

目的:编码一帧

具体过程:

{

初始化写码流。

如果有必要,转换色彩空间,并且把原始图像拷贝到有边框的图像空间,但是没有扩展边框。

将重建帧交换成参考帧

从帧队列中获取当前帧

设置Encoder结构体的current结构体的vol_flagsvop_flagsmotion_flagsfcodebcodequant字段。

调用call_plugins,在里面调用rc_single_before做码率控制的初始化,以及对current结构体的其他变量进一步设置

通过帧号或者MEanalysis函数分析来确定编码类型,并且根据用户的设置作修正。

MEanalysis的原理是,如果某个宏块的残差的sad大于该宏块的平均值的偏离,那么使用intra方式,否则使用inter方式,然后对这些宏块进行统计,得到整帧的编码方式。

 

如果编码类型是I_VOP

{

设置Encoder->mbParam->vol_flags

设置Encoder->mbParam.par

根据vol_flags设置vop_flags

调用FrameCodeII帧的方式编码

调用call_plugins,在里面调用rc_single_after,进行码率控制。

}

 

如果编码类型是P_VOP

{

mbParam.vol_flags固定住pEnc->current->vol_flags

调用FrameCodePP帧的方式编码

调用call_plugins,在里面调用rc_single_after,进行码率控制。

}

}// xvid_encore

 

4, static int FrameCodeI(Encoder * pEnc, Bitstream * bs)

目的:将一帧图像编码成一个I

具体过程:

XVID_PLG_FRAME参数调用call_plugins,该函数目前的作用是设置dquant,可以在该函数中设置最好质量。

调用SetMacroblockQuants,为每个宏块设置量化因子,所以也可以在这里设置最好质量

调用BitstreamWriteVolHeader,写vol

调用set_timecodes,设置时间编码。

调用BitstreamPad,填充bit至字节对齐

调用BitstreamWriteVopHeader,填写vop

 

依次读取每一个宏块,进行编码

{

调用CodeIntraMB设置编码模式为intra,将所有和运动有关的变量设为0

调用MBTransQuantIntra进行变换编码

{

调用MBTrans8to16将像素的表示方法从8bit扩大到16bit

调用MBfDCT对像素进行变换编码

调用MBQuantIntradct系数进行intra方式的量化

调用MBDeQuantIntradct系数进行intra方式的反量化

调用MBiDCT将恢复的dct系数进行反变换

调用MBTrans16to8将恢复的16bit像素饱和到8bit,组成重建宏块

}//MBTransQuantIntra

 

调用MBPredictionacdc预测

{

调用get_dc_scaler函数得到量化系数

调用predict_acdc得到预测方向以及在该预测方向上的和当前块的同一量化水平的预测值

调用calc_acdc_bits以确定是只使用DC预测,还是DCAC预测。原理是分别作DC预测和DCAC预测,分别计算在这2种情况下需要的码流长度,以确定哪种方式更节约码流。

调用CodeCoeffIntra_CalcBits,用于确定各种方式下的码流长度

根据预测模式的不同,恢复成相应的系数

最后计算该宏块的cbp

}//MBPrediction

 

调用MBCoding将宏块编制成码流

{

调用CodeBlockIntraintra宏块编制成码流

{

编码mcbpc

编码ac预测标记

编码cbpy

对于6个块里的每个块

首先编码DC系数

调用CodeCoeffIntra对剩下的63个系数进行编码

}//CodeBlockIntra

}//MBCoding

 

}//依次读取每一个宏块,进行编码

 

填充bit,直到字节对齐

 

 

5, static int FrameCodeP(Encoder * pEnc, Bitstream * bs)

含义:将一帧图片编码成P

具体过程:

{

如果参考帧还没有设置边框,那么就调用image_setedges设置边框

如果需要半像素运动估计,那么就调用image_interpolate进行插值

将一帧填充边框后的参考帧,分成8*8的小块,对于每个小块进行插值,如下:

调用interpolate8x8_halfpel_h进行水平插值

调用interpolate8x8_halfpel_v进行垂直插值

调用interpolate8x8_halfpel_hv进行对角线插值

用参数XVID_PLG_FRAME调用call_plugins,该函数目前的作用是设置dquant,可以在该函数中设置最好质量。

调用SetMacroblockQuants,为每个宏块设置量化因子,所以也可以在这里设置最好质量

调用MotionEstimation做运动估计

{

使用MotionFlags变量保存要使用的运动算法集合

使用skip_thresh保存要达到skip模式的阀值

使用Data保存运动估计要用到的相应变量

对于每个宏块,依次执行如下操作

{

调用sad16v计算本宏块与参考帧对应位置宏块的亮度的残差,将其保存在pMB->sad16中,并按照4个块的方式分别存放pMB->sad8[0-3]

sad00记录最大亮度块残差的4

如果还需要考虑色差块的因素

调用sad8两次,分别计算u分量和v分量的残差,都加入pMB->sad16中,并且也加入sad00

如果该宏块的量化差值为0,并且sad00又没有超过skip模式的阀值

如果已经考虑了色差因素,或者使用xvid_me_SkipDecisionP确认符合skip模式。

调用ZeroMacroblockP将其编码为skip模式,并置标记pMB->mode = MODE_NOT_CODED

根据采用的运动估计算法不同,做相应的设置

调用SearchP做该宏块的运动估计

{

确定是否使用inter4v模式,并记录之

调用get_range确定运动搜索的范围,并记录在Data

调用get_pmvdata2,以获得左,上,右上的运动向量,以及它们对应的sad,存入pmv[1-3]Data->temp[1-3]。然后计算它们的中值,并且存放于pmv[0],并且把最小的sad存放于Data->temp[0]

设置Data的当前宏块的yuv字段。设置Data->RefP[0-5]为参考帧的同一宏块的整像素y,水平半象素y,垂直半象素y,对角线yuv

设置Data->lambda16Data->lambda8,其含义可能是运动向量对带宽的占用折合到sad的值

设置qpel和方向

如果采用qpel,调用get_qpmv2计算用qple方式下的估计中值,存入ata->predMV;否则,Data->predMV0

调用d_mv_bits计算mv需要的编码bit,用于修正pMB->sad16pMB->sad8[0],并将Data->iMinSAD[0-4]设置为pMB->sad16pMB->sad8[0-3],也就是0向量对应的各SAD