数字图像处理 视频编码与压缩

第二十章 视频编码与压缩

目录

1.    引言

2.    有运动补偿的预测编码

3.    运动估计算法

作业


1. 引言

    视频信号具有巨大的数据量,例如:在不做任何压缩的条件下,对于NTSC视频信号的数字化传输需要每秒传30桢720x480的8位象素,达248Mbps;而对于高清晰度视频信号需要每秒传30桢1920x1080的8位象素,高达1.5Gbps;对于35"电影胶片数字化需要4096x3112的10位象素表示,如果每秒传输24桢,则达9Gbps (1.15Gbyte per second)。为了有效地存储和传输视频信号,必须对视频信号进行编码压缩。

    视频是时变图象图象序列,是时空(spatial-temperal)信号,与静态图象相比不仅在空间上存在冗余,而且在时间上存在冗余。视频的压缩一方面可以利用图象本身的空间相关性,还可以利用时间上的相关性。视频编码需要将桢内(intraframe)编码和桢间(interframe)编码混合起来达到高的压缩率。桢内编码即单幅图象本身的编码过程,通常采用DCT变换编码方法,参见第十四章。桢间编码可分为无运动补偿的差分脉码调制(DPCM)和有运动补偿的差分脉码调制。

2. 有运动补偿的预测编码

    桢内编码通常是以宏块为单位的DCT编码,桢间编码是在桢内编码的基础上进行的,在不同桢之间以对应的宏块为对象进行DPCM编码。所谓运动补偿是指对宏块在下一桢的位置做运动估计,将该运动估计用于确定下一桢对应宏块的位置,再进行DPCM编码,使编码考虑了图象的运动分量,即对运动做了补偿,提高编码效率。

    如下图所示,对于大小为NxM的宏块的运动估计是在参考图象中一定的范围内寻找最佳的匹配的过程[1]。这种估计方法实际上是假设宏块内部象素具有同样的运动参数,即平滑性约束条件。这只能是一种近似方法,宏块越小平滑性就越好,但运动估计的可靠性也越差,因为匹配时考虑的象素数目就越少,另外寻找最佳匹配的快速算法对较大的宏块比较有效。考虑到多种因素,在视频压缩标准中,N=M=16,而运动估计范围对于视频广播来说,对于头肩型的视频节目p=15性能较好,而对于运动项目则p=63可以获得较好的效果。

3. 运动估计算法

    运动估计中的匹配准则采用模板匹配方法,定义代价函数如下:

       平均绝对误差(MeanAbsolute Error):

       

    运动估计是搜索一定范围内使上述误差最小的运动矢量的过程。运动估计算法是个搜索算法,有完全搜索、两维对数搜索等多种不同的算法,差别主要在于计算量、精度和是否可以获得最佳解。

3.1 完全搜索

最简单的方法是完全搜索,可以保证得到最佳估计。对于桢率为F而大小为IxJ的视频需要:

 (OPS: operation per second)

对于典型的广播视频(I=720, J=480, F=30),基于完全搜索的运动估计当p=15时需要29.89GOPS (Giga operations per second),当p=7时需要6.99GOPS。可见这种方法计算量很大。

3.2 两维对数搜索

    两维对数搜索与折半查找相似。第一步,将[-p,p]的搜索矩形分成两个区域:一是内部的[-p/2,p/2](取整数)矩形,二是它之外的部分。进一步,我们仅在9个位置上:(0,0)点和[-p/2,p/2]矩形边界上的8个主要点,计算各自的平均绝对误差(MAE),而不是其整个区域。即若设这些点彼此的距离为d1,则我们从如下的9个点:(0,0),(0,d1),(0,-d1),(-d1,0),(d1,0),(d1,d1),(d1,-d1),(-d1,d1),(-d1,-d1),计算最小的MAE,距离d1由下式给出:

例如,当p=7时, k=3, d1=4。用目前最佳匹配的位置作为起点,通过计算位于d2= d1/2距离上的8个点获得下一个最佳匹配位置。如此循环进行下去,直到第k次循环时距离为1个象素时为止。

    对于桢率为F而大小为IxJ的视频需要:

 (OPS: operationper second)

对于典型的广播视频(I=720, J=480, F=30),基于两维对数搜索的运动估计当p=15(k=4)时需要大致1GOPS,计算复杂性仅为完全搜索方法的3.3%。

    常用的三步对数搜索(TSS, Three-Step Search)过程如下图所示,其中可,k=3,p=7 (对于视频会议系统,p=7就可以获得足够好的性能):

    此外,还有许多其它运动估计方法,例如并行分层一维搜索(Parallel hierarchical one-dimensionalsearch (PHODS),分层运动估计等[1]。.

作业

参考文献

1.     VasudevBhaskaran, Konstantinos Konstantinides, Image and video compression standards:algorithms and architectures, Kluwer Academic Publishers, Boston, 1995.

2.    钟玉琢,多媒体技术,(高级),清华大学出版社,1999。

3.    A.M. Tekalp (崔之祜、江春、陈丽鑫 译), Digital video processing, PrenticeHall 电子工业出版社,1998。

4.     P.K.Andleigh, K. Thakrar (徐光佑、史元春译),多媒体系统设计,Prentice Hall, 1998.

5.     BorkoFurht, Stephen W. Smoliar, HongJiang Zhang, Video and image processing inmultimedia systems, Kluwer Academic Publishers, Boston ,1995.


返回主目录返回本章目录

清华大学计算机系 艾海舟

最近修改时间:2000年4月11日

出处:http://media.cs.tsinghua.edu.cn/~ahz/digitalimageprocess/CourseImageProcess.html

0
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值