光流法的四种方法(正/反,Additive/Compositional)

转自:https://blog.csdn.net/wendox/article/details/52505971

光流法的目标是完成图像点的跟踪, 因此这里假设存在一个输入图像I, 以及要跟踪的点x, 存在另外一个图像块T, 我们的目标是完成图像块T到输入图像I的匹配.

文章针对Lucas-Canade光流法做了一个总结, 
文章对lucas-canade (Forward Additive, FA)算法做了简介, 引入了Compositional算法以及Inverse方法. 因此对应组合形成4种方法分别是Forward Additive(FA), Forward Compositional(FC)以及新提出的Inverse Compositional(IC)算法, Inverse Additive(IA)算法. 对这4种方法文章分别从算法的目标, 算法的推导, 算法对wrap矩阵的要求, 算法计算复杂度以及算法与其他方法的等效情况.

除了四种方法的原理, 文章还介绍了几种优化方法如何实现上述光流的计算. 从高斯牛顿开始介绍, 文章介绍了牛顿法的原理以及对牛顿法的改进. 高斯牛顿法是对牛顿法的一种近似. 当牛顿法中的Hessian矩阵使用雅克比近似时, 牛顿法变为高斯牛顿. 当Hessian矩阵使用c*I(对角为c, 其他元素为0)的矩阵, 牛顿法变为梯度下降法.

Lucas-Kanade 光流法简介



增量方式\更新方式forwardinverse
additiveFAIAIAIA
compositionalFCIAICIA

前向与后向的对比

前向方法对于输入图像进行参数化(包括仿射变换及放射增量). 后向方法则同时参数输入图像和模板图像, 其中输入图像参数化仿射变换, 模板图像参数参数化仿射增量. 因此后向方法的计算量显著降低. 由于图像灰度值和运动参数非线性, 整个优化过程为非线性的.

参数化过程主要要计算: 图像的梯度, 位置对运动参数导数, 运动参数增量. 前向方法中Hessian是运动参数的函数. 提高效率的主要思想是交换模板图像和输入图像的角色. 
后向方法在迭代中Hessian是固定的.

前向方法和后向方法在目标函数上不太一样,一个是把运动向量pp都是跟着I(被匹配图像),但是前向方法中的迭代的微小量ΔpΔp使用I计算的,后巷方法中的ΔpΔp使用T计算的。因此计算雅克比矩阵的时候,一个的微分在ΔpΔp处,而另外一个在0处。所以如果使用雅克比矩阵计算Hessian矩阵,后者计算的结果是固定的。 
举例: 
FAIA的目标函数(前向方法) 

x[I(W(x;p+Δp))T(x)]2∑x[I(W(x;p+Δp))−T(x)]2

ICIA的目标函数(后向方法) 
x[T(x;Δp)I(W(x;p))]2∑x[T(x;Δp)−I(W(x;p))]2

如果使用一阶泰勒展开FAIA(前向方法)的目标函数变为 
x[I(W(x;p))+IWpΔpT(x)]2∑x[I(W(x;p))+∇I∂W∂pΔp−T(x)]2

ICIA(后向方法)的泰勒展开为 

x[T(W(x;0))I(W(x;p))+TWpΔp]2∑x[T(W(x;0))−I(W(x;p))+∇T∂W∂pΔp]2

而雅克比矩阵为 

Wp=[x,0,y,0,1,00,x,0,y,0,1]∂W∂p=[x,0,y,0,1,00,x,0,y,0,1]

只和xy有关,图像I的梯度是要在 W(x;p)W(x;p) 处计算的,后向方法中图像T的梯度在 W(x;0)W(x;0) Hessian处计算,因此Hessian矩阵不依赖与 pp 。 后向方法中对模板图像参数化, Hessian矩阵只需要计算一次. 因为模板是在迭代过程中(优化 pp )的每一步固定的。因此会减小计算量。而对输入图像参数化, 由于输入图像的位置是运动的函数, 因此运动参数变化后, 梯度需要重新求解.

Compositional 与 Additive对比

通过增量的表示方式来区分方法. 迭代更新运动参数的时候,如果迭代的结果是在原始的值(6个运动参数)上增加一个微小量,那么称之为Additive,如果在仿射矩阵上乘以一个矩阵(增量运动参数形成的增量仿射矩阵),这方法称之为Compositional。两者理论上是等效的,而且计算量也差不多。

算法的目标

FAIA:

x[I(W(x;p+Δp))T(x)]2∑x[I(W(x;p+Δp))−T(x)]2

FCIA:
x[I(W(W(x;Δp);p))T(x)]2∑x[I(W(W(x;Δp);p))−T(x)]2

ICIA以及,IAIA:
x[T(W(x;Δp))I(W(x;p))]2∑x[T(W(x;Δp))−I(W(x;p))]2

对于warp的要求

FAIA: W(x,p)W(x,p)对于pp可微. 
FCIA: warp集合包含identitywarp, warp集合包含在Composition操作上是闭的(semi-group), 其中包括Homograph, 3D rotation等. 
ICIA: semi-group, 另外要求增量warp可逆, 其中包括Homograph, 3D rotation等, 但不包括piece wise affine. 
IAIA: 适用于2D平移, 2D相似, 2D仿射等.

算法简介

FAIA

目标函数为 

x[I(W(x;p+Δp))T(x)]2∑x[I(W(x;p+Δp))−T(x)]2

更新的方式为 
pp+Δpp←p+Δp

步进的计算方法为 
Δp=H1x[I(W)(x;p)T(x)]Δp=H−1∑x[I(W)(x;p)−T(x)]

算法每个步骤中的时间复杂度 
这里写图片描述  
伪代码 
这里写图片描述

FCIA

目标函数为 

x[I(W(W(x;Δp);p))T(x)]2∑x[I(W(W(x;Δp);p))−T(x)]2

更新方式为 

W(x;p)W(x;p)W(x;Δp)W(x;p)←W(x;p)∘W(x;Δp)

步进的计算 
Δp=H1x[I(W)(x;p)T(x)]Δp=H−1∑x[I(W)(x;p)−T(x)]

ICIA

为了避免花费很多时间来计算hessian矩阵,如果该矩阵是恒定的,那么只需要计算一次.然后事实上Hessian矩阵是关于pp的函数,很多研究给出了该矩阵的近似计算方法,然而很难估计近似的效果,有的时候近似不是很完善.提出该方法的出发点是交换图像和模板, 
文章给出了前向和反向的方法是等效的,并给出了证明. 
这里写图片描述 
对比IAIA发现ICIA的迭代中不需要对图像梯度进行wrap, 另外计算Hessian中同样如此.

IAIA

仍然是交换I和T. 这样可以避免每个迭代中计算梯度图像. 

x[I(W(x)+T(Wx)1WppT(x)]2∑x[I(W(x)+∇T(∂W∂x)−1∂W∂pp−T(x)]2

update 
pp+Δpp←p+Δp

实际上这种方法能够使用的运动很少, 对于warp的要求很高, 因此不常用. 文中之后给出了the Inverse Additive 和 Compositional Algorithms 方法在 Affine Warps中的等效性.

总结

  • 两个前向方法的计算复杂度相似,后向方法几乎相等.后向方法的速度远比前向方法要快.
  • 前向additive可以用于任何变形(warp),
  • 反向compositional只能用于warps that form groups.
  • 反向additive 可以用于simple 2D linear warps such as translations and affine warps. 
    如果不进考虑效率的话可以使用两种前向方法.前向compositional的方法中Jacobian是常量,因此有一定的优势.

如果效率很重要的话,那么后向compositional方法是首选,推导很简单,很容易确定.

雅克比矩阵和残差计算的方式有关, 由于 compositional 计算误差的方式会使得雅克比矩阵为常数,通常采用compositional的形式

梯度下降方法的近似

文章介绍了4种方法分别是高斯牛顿, LM, 梯度下降和Hessian矩阵对角近似. 对这些方法文章分别进行了分step性能, iteration性能等的测试.

牛顿法中通过对Hessian使用雅克比矩阵近似可以得到高斯牛顿.

Algorithmorder of the Taylor approximationsHessianwork better at
The Gauss-Newton Algorithmfirst order approximations to the Hessian
The Newton Algorithmsendond order  
Steepest Descent-indentity matrixfurhter away from lcoal local minima
The Levenberg-Marquardt Algorithmcombine diagonal and full Hessianerror gets worse 

结论

  1. Gauss-Newton 和 Levenberg-Marquardt的收敛性能类似, 但跟另外2种方法稍好.
  2. Levenberg-Marquardt实现的效率和Gauss-Newton接近, 并且不好好于高斯牛顿.

这里写图片描述

算法的选择

  • 噪声,如果图像的噪声比较大,那么最好使用反向算法,反之使用前向方法.
  • 关于效率的已经讨论过了.

refer

  1. project mainpage https://www.ri.cmu.edu/research_project_detail.html?project_id=515&menu_id=261 
    2.https://www.cs.cmu.edu/afs/cs/academic/class/15385-s12/www/lec_slides/Baker&Matthews.pdf
  • 2
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
SLAM地图构建与定位算法,含有卡尔曼滤波和粒子滤波器的程序 SLAM算法的技术文档合集(含37篇文档) slam算法的MATLAB源代码,国外的代码 基于角点检测的单目视觉SLAM程序,开发平台VS2003 本程序包设计了一个利用Visual C++编写的基于EKF的SLAM仿真器 Slam Algorithm with data association Joan Solà编写6自由度扩展卡尔曼滤波slam算法工具包 实时定位与建图(SLAM),用激光传感器采集周围环境信息 概率机器人基于卡尔曼滤波器实现实时定位和地图创建(SLAM)算法 机器人地图创建新算法,DP-SLAM源程序 利用Matlab编写的基于EKF的SLAM仿真器源码 机器人定位中的EKF-SLAM算法,实现同时定位和地图构建 基于直线特征的slam机器人定位算法实现和优化 SLAM工具箱,很多有价值的SLAM算法 EKF-SLAM算法对运动机器人和周围环境进行同步定位和环境识别仿真 SLAM using Monocular Vision RT-SLAM机器人摄像头定位,运用多种图像处理的算法 slam(simultaneous localization and mapping)仿真很好的入门 SLAM自定位导航的一个小程序,适合初学者以及入门者使用 slam算法仿真 slam仿真工具箱:含slam的matlab仿真源程序以及slam学习程序 移动机器人栅格地图创建,SLAM方法,可以采用多种地图进行创建 SLAM算法程序,来自悉尼大学的作品,主要功能是实现SLAM算法 对SLAM算法中的EKF-SLAM算法进行改进,并实现仿真程序 SLAM的讲解资料,机器人导航热门方法

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值