Action Recognition with Improved Trajectories(2013)
本文是DT的升级版
主要贡献
1.提出一种去除相机运动产生的轨迹的方法
2.提出对人占屏比大的帧采用DPM进行行人检测,去除人的部分,再做相机运动估计。
(这两点都是用于对计算的轨迹进行优化,降低算法以外的因素带来的影响)

如图所示,第一排是两个连续帧叠加在一起,第二排是直接进行光流估计,第三排是去除了相机运动后的光流估计,第四排中白色的箭头是相机运动产生的trajectories。
Camera motioin estimation
第一步,假设两个连续的帧是同域(homography)的,(homography这里直接翻译是同域的意思,在论文里指的是两帧的差别不大,物体运动很小,例如连续两帧中的天空,基本都是一样的,那这两帧就属于homography)
第二步,使用SURF特征(SIFT的快速版,也是升级版)和光流估计来匹配特征点对,其中,SURF更注重区域块,在前面的文章《使用增强运动向量CNNs的实时行为识别》中提到光流是基于像素的,因此这两种方法是互补的,结合使用效果更好。之所以使用SURF是因为它对于运动模糊和旋转的图像有较好的鲁棒性(但不善于处理视角变化和光照变化)。
第三步,使用RANSAC(随机抽样一致)来估计匹配的特征点对,从而得出连续两帧的投影变换矩阵,根据投影变化矩阵可得到相机运动。
&

最低0.47元/天 解锁文章

1608

被折叠的 条评论
为什么被折叠?



