MPEG-2视频编码方式

最新推荐文章于 2021-06-14 22:32:21 发布

xfortius

最新推荐文章于 2021-06-14 22:32:21 发布

阅读量2.5k

点赞数

http://www.360doc.com/content/06/0718/15/9571_158909.shtml

为了提高压缩比及图像质量，MPEG-2视频编码采用运动补偿预测（时间预测+内插）消除时间冗余和不随时间变化的图像细节；采用二维DCT（图像像素+量化传输系数）分解相邻像素，消除观众不可见、不重要的图像细节；采用熵值编码（已量化参数+编码参数的熵），使bit数减少到理论上的最小值。对以上3种压缩技术，作如下说明：

1）运动补偿预测

将存储器中前一图像帧的重建图像中相应的块按编码器端求得的运动矢量进行位移，这就是运动补偿过程。为了压缩视频信号的时间冗余度（Temporal Redundancy），MPEG采用了运动补偿预测（Motion Compensated Prediction），图17是其运动处理过程示意图。运动补偿预测假定：通过画面以一定的提前时间平移，可以局部地预测当前画面。这里的局部意味着在画面内的每个地方位移的幅度和方向可以是不相同的。采用运动估值的结果进行运动补偿，以便尽可能地减小预测误差。运动估值包括了从视频序列中提取运动信息的一套技术，该技术与所处理图像序列的特点决定着运动补偿性能的优劣。与画面16×16像素宏块相关的运动矢量支持接收机解码器中的运动补偿预测。所谓预测，实际上是由前一(n-1)图像帧导出当前（n）图像帧所考虑像素的预测值，而后由运动矢量编码传输n帧的实际像素值与其预测值之间的差值。例如，设宏块为M×N的矩形块，将图17中的n-1帧的宏块与n帧的宏块进行比较。这实际上是一个如图18所示的进行宏块匹配的运动补偿过程，即将n帧中16×16像素的宏块与n-1帧中限定搜索区(SR)内全部16×16像素的宏块进行比较。若n-1帧图像亮度信号为f n -1 (i , j)，n帧图像亮度信号为f n (i , j)，其中(i , j)为n帧的M×N宏块的任意位置,并将n帧中的一个M×N的宏块看作是从n-1帧中平移而来的，而且规定同一个宏块内的所有像素都具有同样的位移值(k，l) 。这样，通过在n-1帧限定搜索区（SR）内进行搜索，总可以搜索到某一宏块，使得该宏块与n帧中要匹配的宏块的差值的绝对值达到最小，并得到运动矢量的运动数据，在n-1帧和运动数据的控制下，获得n帧的一个相应的预测值。照此办理，直到n帧的M×N宏块的任意位置（i , j）的像素全部通过n-1帧的像素预测出来。即n帧与n-1帧的相关函数F(k , l)的绝对值表示为：

式（1）表明要匹配的宏块已经匹配，并得到水平及垂直位移为（k , l）的运动矢量的运动数据。通过匹配不仅将传输的差值减到最小，而且补偿了匹配对象在图像中的位移，这就是运动补偿。为了改善预测效果，可以采用场预测。由于在电视图像连续帧之间有较大程度的共同性，即时间冗余度，多数图像之间差值极小，尤其是在大多数时间传输小范围内的值时，采用运动补偿预测可使码率明显降低。在接收端的解码器中以同样的运动补偿预测重现预测值，重现预测值加上差值就得到像素的原幅值。图 19是基本MPEG视频编码器框图，图中虚线左边为运动补偿预测编码所需要的基本功能器件。其中固定存储器存储n-1帧的复原数据，将其与n帧数据一同送入运动补偿参数估值器，估值后就可以得到运动矢量的数据。用运动矢量数据和n-1帧的复原数据去控制用于块匹配的可变存储器，将n帧的当前像素值预测出来。这里，预测是按帧差仅有1帧进行的，实际上MPEG-1和MPEG-2可以当前帧之前若干帧的某一帧为基准进行预测。值就得到像素的原幅值。图 19是基本MPEG视频编码器框图，图中虚线左边为运动补偿预测编码所需要的基本功能器件。其中固定存储器存储n-1帧的复原数据，将其与n帧数据一同送入运动补偿参数估值器，估值后就可以得到运动矢量的数据。用运动矢量数据和n-1帧的复原数据去控制用于块匹配的可变存储器，将n帧的当前像素值预测出来。这里，预测是按帧差仅有1帧进行的，实际上MPEG-1和MPEG-2可以当前帧之前若干帧的某一帧为基准进行预测。

需要说明的是：MPEG定义了基于帧、基于场及双场的图像预测，也定义了16×8的运动补偿。

MPEG-2：有逐行扫描方式，可以采用基于帧的图像预测；有隔行扫描方式，也可以采用基于场的图像预测。因此，MPEG-2编码器要对每个图像先判断是帧模式压缩还是场模式压缩。在隔行扫描方式下：运动少的场景时，采用基于帧的图像预测，因为基于帧的图像两相邻行间几乎没有位移，帧内相邻行间相关性强于场内相关性，从整个帧中去除的空间冗余度比从个别场中去除得多；剧烈运动的场景时，采用基于场的图像预测，因为基于帧的相邻两行间存在1场延迟时间，相邻行像素间位移较大，帧内相邻行间相关性会有较大下降，基于场的图像两相邻行间相关性强于帧内相邻行间相关性，在1帧内，场间运动有很多高频分量，从场间去除的高频分量比从整个帧中去除的多。由上述可见，选择基于帧的图像预测还是基于场的图像预测的关键是行间相关性。所以，在进行DCT之前，要作帧DCT编码或场DCT编码的选择，对16×16 的原图像或亮度进行运动补偿后所获得的差值作帧内相邻行间和场内相邻行间相关系数的计算。若帧内相邻行间相关系数大于场内相邻行间相关系数，就选择帧DCT编码，反之选场DCT编码。帧DCT编码与场DCT编码如图20所示。