运动估计
运动估计的英文名称是Motion Estimation. 是视频编码和视频处理(例如去交织)中广泛使用的一种技术. 运动估计的基本思想是将图像序列的每一帧分成许多互不重叠的宏块,并认为宏块内所有象素的位移量都相同,然后对每个宏块到参考帧某一给定特定搜索范围内根据一定的匹配准则找出与当前块最相似的块,即匹配块,匹配块与当前块的相对位移即为运动矢量。视频压缩的时候,只需保存运动矢量和残差数据就可以完全恢复出当前块。
基于块的运动表示法
块匹配法的基本思想是先将图像划分为许多子块,
然后对当前帧中的每一块根据一定的匹配准则在相邻帧中找出当前块的匹配块,
由此得到两者的相对位移,即当前块的运动矢量。
在H.264标准的搜索算法中,图像序列的当前帧被划分成互不重叠16×16大小的子块,
而每个子块又可划分成更小的子块,当前子块按一定的块匹配准则在参考帧中对应位置的一定搜索范围内寻找最佳匹配块,
由此得到运动矢量和匹配误差。运动估计的估计精度和运算复杂度取决于搜索策略和块匹配准则。
三步搜索(Threestepseareh, TSS),
是早期的代表算法,它是一种由粗到细的搜索算法, 快速且高效" TSS
第一步从最大搜索范围的一半开始"在每一步长的搜索中,
比较搜索区域正方形的中心点和八个方位上的搜索点,
一共九个搜索位置. 将上一步得到的最佳匹配点作为下一步的搜索中心点,
并将步长减半执行相似的搜索, 逐步缩小搜索范围,
直至搜索步长为一个像素时得到最佳匹配位置.
四步搜索(Fourstepseareh, FSS)
优化了三步搜索出现局部最优的情况, 并且兼顾了块的大范围运动.
该算法类似于三步法,但它基于现实中序列图像的一个特征,
即运动矢量都是中心分布的, 从而在 5*5 大小的搜索窗口上构造了有9个检测点的搜索模板.
FSS算法首先采用 5*5 的搜索窗口, 避免造成搜索方向的偏离, 每一步的搜索范围由上一步的最佳匹配位置决定,
并且将搜索窗的中心移向上一步最佳匹配点处, 前三步的搜索是定步长搜索, 最后一步改变步长,
得到最后的最佳匹配位置.
菱形搜索(DiamondSeareh,ns)
是一种性能优异, 使用广泛的算法.
它有两个不同大小的匹配模板: 大菱形搜索点阵(LDSP:LargeDiamondsearch Pattern)和小菱形搜索点阵(sDSp:SmallDiamondSearchpattern),如图3一5所示, 左边的大菱形搜索点阵的步长为2个像素,右边小菱形搜索点阵的步长为1个像
32素. Ds算法结合这两种匹配模板沿误差梯度方向移动搜索点阵,具有较好的综合性能"