Improvements on Fast Motion Estimation Strategy forH.264/AVC
(主要思想,增加自适应的和与QP、scale相关联的阈值)
I.Introduction和II. review都是和那一篇总述论文大同小异的。
III.存在问题和分析
1、 整像素快速搜索与不同的QP
随着QP的增加,快速算法的RD表现会越来差。两个原因:
1) QP的变大,会是MCOST的值得分布变得更分散,根据观察可得,最佳点的MCOST会随QP的增大而略增大,因此,阈值应该随着QP的增大而调整的略大。
2) QP大时码率小,图像模糊,最优点与次优点的MCOST的差距会变小,也容易造成误判,相反,QP小码率大,图像精细,最优点与次优点更容易区分。
2、 整像素快速搜索与不同的图像尺寸
对于同样的搜索范围,较大尺寸的视频会有更好的RD表现,但是有较差的加速能力。具体原因如下:
同样大小的一个块在大尺寸的视频中所占的比例很小,会更平滑,所以包含的内容和细节会更少,这样细节少的图像更容易找到更精确地匹配块,所以预测更准确,PSNR损失更小。但是同样的阈值对于大尺寸图像会使ME过程更慢。
3、 ET(提前截止)策略的分析
ET出现的地方:
1) 开始点选择后
2) 十字搜索后
3) 5*5正方形搜索后
4) 16点复合六边形搜索后
每当复合符合ET条件后会跳出搜索过程直接进入再求精(refinement)的搜索步骤。
出现问题:四个步骤用同样的阈值,通过统计发现,以UMHS(十字+六边形搜索算法)为例,16点的六边形搜索基本上根本用不到ET!
4、 子像素快速算法的局限
中值预测作为小尺寸块的快速分像素搜索中准确度更高,CBFPS算法只用了小于等于8*8的块尺寸来保证RD效果。
随着整像素算法的提升,分像素算法的复杂度甚至会超过整像素的复杂度,所以加速分像素算法很有必要。
IV.提出的方法
1、 自适应的ET阈值
常用的三种阈值:
1) 固定值
2) MCost(论文引用[4][6][8])
3) 与QP有关的阈值(论文引用[4])
可变的阈值比固定的阈值更有效。
提出方法:这种方法是基于UMHS和CBFPS的。
第一个阈值Threshold1在中值预测的起始点
第二个阈值Threshold2在UMHS算法后,即16点的六边形搜索后,用16点的最耗点代价与阈值比较。
Threshold代表两个阈值,Thd_Base是最小视频尺寸,最小QP时得出的一个集合。阈值1的Thd_Base比阈值2的Thd_Base略小,因为阈值1比阈值2判断的更早。QP_factor是与QP有关的参数,Scale_factor是与视频大小有关的参数,理论上是为了在QP大Scale小的视频有更大的阈值。A、B是实验中决定的参数,在后续的实验仿真中,可以看到作者在整像素时A=0.9,分像素是A=0.4,B=0.3
2、 快速分像素搜索的改进算法
为分像素算法都添加提前截止。
当块大小大于等于8*8时,进行全搜索,在计算完1/2像素之后添加阈值,如果小于阈值跳过剩余1/2像素直接进行1/4像素的搜索;在1/4像素搜索时添加阈值,如果小于阈值,则跳过其他的1/4像素搜索
当块大小小于等于8*8时,进行的是CBFPS,在中值搜索MP之后,进行与整像素类似的阈值判断。