论文题目:Fast integer-peland fractional-pel motion estimation for H.264 AVC
摘要:
这篇论文是一篇综述性的介绍H.264中运动估计中整像素与分像素搜索的快速算法。
整像素搜索:介绍了UMHexagonS算法,非对称十字-多层六边形网格搜索
提出了CBFPS算法,中心偏移的子像素搜索算法
讨论了ET,提前截止
Introduction:
(1)整像素部分
TSS(三步)、FSS(四步)、HEXBS(基于六边形的)、DS(钻石)、EPZS,局限于较小的搜索范围和图像尺寸。而且在运动量大和尺寸大的视频,比如Bus、Stefan视频中,HEXBS等算法会陷入局部最优。也有很多方法来避免局部最优,比如用相邻帧的匹配块或者当前块的邻居块的运动矢量来预测,但是这也可能预测错误,比如说参考帧中的匹配块们的运动并不相同(好像有点不准确)。实验证明,这些算法在强烈和不规则运动会导致1-2dB的失真。
为了避免陷入全局最优,主题思想是,全局搜索(global search)与局部(local search)搜索相结合,全局搜索用粗糙网格(coarse grid)/稀疏网格(sparse grid)的搜索,局部的搜索用精细网格(fine search)的搜索。典型例子HEMGS(水平与复合的网格搜索,论文中引用[10])。
提出UMHexagonS算法,该算法后面仔细讲。大体分四步,可以节省90%的时间。
(2)分像素部分
过去的算法见论文引用[21][22]。提出CBFPS算法,该算法被JVTproposals采用。可以减少50%的1/4和1/8像素搜索的计算量,虽然264不包含1/8像素的搜索。
(3)提前截止部分
在UMHexagonS算法和CBFPS算法中添加了提前截止部分。关于SAD的统计模型可以帮助提前截止部分,做到视频质量和计算复杂度的较好权衡。
2、对于运动向量和SAD分布的统计分析
运动向量的统计分析有利于起始点的选择,SAD分布的统计有利于提前截止的阈值选择。
要充分利用时域和空域的相关性。其中,空域的相关性包括两方面:邻居块的之间的相关性以及同一块的相邻模式之间的相关性(感觉理解起来有点模糊P268上边一段中);时域的相关性包括相邻图片之间的相关性以及相邻参考帧之间的相关性。
2.1MV分布的统计分析
MP预测:中值预测,是当前块的左边块A、上边块B、左上块C三个MV的中值作为MP预测。