【ipaper】Visual Odometry 和 Visual SLAM概述:第五部分

【ipaper】 An Overview to Visual Odometry and Visual SLAM: Applications to Mobile Robotics 第五部分

Localization

Stereo Vision Versus Monocular Vision

Stereo Visual Odometry

在双目视觉中,在单个时间步长(single time-step)中通过三角测量重建3D信息,同时观察在空间上被已知基线距离分开的左右图像的特征。在Stereo VO中,通过观察两个连续帧(in both right and left images)中的特征来估计运动。以下步骤概述了使用3D to 2D运动估计的stereo VO的常用过程:

  • 1、在时间 I 中,提取并匹配 right frame FR(I)left frame FL(I) ,在3D中通过三角测量重构点(reconstruct points)。
  • 2、将这些功能与下一帧 FR(I + 1)FL(I + 1) 中的相应功能相匹配。
  • 3、Estimate the transformation 这个转换(transformation)给出了一个相机的图像(左或者右边)所观察到的特征与将该转换应用到了当前帧之后,前一帧重建的3D点之间的最小平方差(SSD)(见公式二):

  • 4、使用RANSAC优化,仅基于内部点重新计算转换。 (参见“Refining the Transformation Using ICP”部分)
  • 5、将获得的变换与先前估计的全局变换连接起来。
  • 6、在每一个迭代时间内,重复以上步骤。

Monocular Visual Odometry

对于通过三角测量在3D中重建特征点,需要在连续帧(时间分离帧)中观察它们。在monocular VO中,需要在至少三个不同的帧中观察特征点(观察第一帧中的特征,重新观察并在第二帧中三角形化为三维点,然后计算第三帧中的变换)。monocular VO的一个主要问题是尺度模糊问题。与双目视觉系统不同,双目视觉系统可以得到最开始的两个帧的变换(旋转和平移)而单目视觉中前两个连续帧之间的变换并不能完全得到(比例未知),通常情况下将它设置为一个预定值。因此,重建的3D点以及对应的变换都是相对于前两帧之间的初始预定义比例的。除非有关于3D结构或初始变换的附加信息可用,否则无法获得全局尺度。[89]讲到,可以使用其他的传感器(Imu,车轮编码器,GPS)收集那些所需要的信息。monocular VOstereo VO的流程基本相似,但是monocular VO的特征点的三角测量发生在不同的时间(连续帧)

使用3D到2D运动估计的monocular VO的可能的过程在以下步骤中描述:

  • 1、在 time step I 中提取第一帧 FI 的特征,并且指定描述符。
  • 2、提取下一帧 FI+1 的特征,并且指定描述符。
  • 4、匹配两个连续帧之间的特征,使用5点算法(5-point algorithm)[86]估计前两帧之间的变换(使用预定义比例),并使用此变换对相应点进行三角测量(3D点将达到假设的比例)。
  • 4、提取 接下来的 FI+2 帧的特征,将它与先前帧中提取的特征进行匹配。
  • 5、使用RANSAC优化匹配并估计转换,该转换给出当前帧 FI + 2 中观察到的特征与应用之后从前两帧重建的重新投影3D点之间的最小平方差之和(SSD)(见方程2)。这个过程称为透视N点(PnP)算法[74]。
  • 6、使用估计的变换将FI + 1FI + 2之间的匹配到的特征对三角化为3D点。
  • 7、设置 I = I + 1 ,每次迭代从步骤4开始重复。

Visual Odometry Based on Optical Flow Methods

光流计算用作局部图像运动的替代测量(surrogate measurement)。通过分析图像平面中的运动对象的投影时空模式来计算光流,并且其在像素处的值指定该像素在连续图像中移动了多少。
光流测量物体和观察者之间的相对运动[47],并且可用于估计移动机器人或相机相对于其环境的运动。
光流的计算基于强度一致性(Intensity Coherence assumption)的假设,该假设表明投影在两个连续图像上的点的图像亮度是(最严格的假设)常数或(最弱假设)几乎恒定[7]。这种假设产生了众所周知的光流约束:

其中 VxVyxy 光流分量。已经提出了许多使用运动约束方程来解决光流问题的算法(参见[115]以获得当前方法的列表)。

计算出每个像素的2D位移 (u,v) 后,可以完全恢复3D摄像机运动。Irani等人.[60]描述了用于纠正相机的6DOF运动参数的等式,其包括三个平移 (Tx,Ty,Tz) 和三个旋转分量 (Ωx,Ωy,Ωz)葫芦导航的方法基于以下方程式:

其中 fc 是相机的焦距,(x,y) 是3D点 (X,Y,Z) 的图像坐标。

假设深度Z是已知的,则存在六个未知数,并且至少需要三个点来完全约束变换。但是在许多情况下会添加额外的限制,例如在平面上移动,这样会减少 DOF 和所需要的最少点数。

参考文献

[7].Bab-Hadiashar, A., Suter, D.: Robust optic flow computation. Int. J. Comput. Vis. 29(1), 59–77 (1998)

[47].Gibson, J.: The Senses Considered as Perceptual Systems. Houghton Mifflin Co, Boston (1966)

[74].Lepetit, V., Moreno-Noguer, F., Fua, P.: EPNP: an accurate O(n) solution to the PnP problem. Int. J. Comput. Vis. 81(2), 155–166 (2009)

[86].Nister, D.: An efficient solution to the five-point relative pose problem. In: Proceedings of 2003 IEEE Computer Society Conference on Computer Vision and Pattern Recognition, vol. 2, Part II, p. 195

[89].Nützi, G., Weiss, S., Scaramuzza, D., Siegwart, R.: Fusion of IMU and vision for absolute scale estimation in monocular slam. J. Intell. Robot. Syst. 61(1), 287–299 (2011)

[115].Xu, L., Jia, J., Matsushita, Y.: Motion detail preserving optical flow estimation. IEEE Trans. Pattern Anal. Mach. Intell. 34(9), 1744–1757 (2012)

[60]Irani, M., Rousso, B., Peleg, S.: Recovery of ego-motion using region alignment. IEEE Trans. Pattern Anal. Mach. Intell. 19(3), 268–272 (1997)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

pxr007

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值