ORB SLAM3论文大致翻译,手动整理

ORB-SLAM3: An Accurate Open-Source Library for Visual, Visual-Inertial and Multi-Map SLAM

ORB-SLAM3,第一个能够用单目、双目和RGB-D,针孔和鱼眼镜头模型进行视觉、视觉惯性和多地图SLAM的系统。基于特征的紧密集成视觉惯性SLAM系统,完全依赖于最大后验概率(MAP)估计,甚至在IMU初始化阶段也是如此。在小型和大型,室内和室外环境中都能稳定地运行。多地图系统,依赖于一种新的位置识别方法和改进的召回。能够在长时间的不良视觉信息下生存:定位失败情况下,当重新访问已经建图的区域时,会启动一个新的地图来和以前的地图无缝合并。是第一个能够在所有算法阶段重用所有先前信息的系统。能BA优化共视关键帧,即使它们在时间上相隔甚远,或者它们来自以前的建图会话。

I. INTRODUCTION

现代系统依赖于最大后验概率(MAP)估计,在视觉传感器的情况下,它对应于光束平差(BA):基于特征的方法中,使特征重投影误差最小化的几何BA;直接方法中,使一组选定像素的光度误差最小化的光度BA。
Visual slam的目标是使用移动代理上的板载传感器来构建环境地图并实时计算代理自身的位姿。相反,VO系统的重点是计算代理的自我运动,而不是建图。SLAM地图优势在于匹配和使用了BA以前的观测数据,通过三种类型的数据关联[1]:
短期:
匹配在过去几秒钟内获得的地图元素。大多数VO系统使用的唯一数据关联类型,一旦环境元素离开视线,就会丢弃,导致系统在同一区域中移动也会产生持续的估计漂移。
中期:
匹配靠近相机的地图元素,累积漂移仍然很小。可以在BA中进行匹配和使用,并且当系统在地图区域移动时,可以达到零漂移。与采用回环检测的VO系统相比,这是提高系统精度的关键。
长期:
使用位置识别技术将观测值与先前访问过的区域中的元素匹配,不考虑累积漂移(回环检测)或跟踪丢失(重新定位)。能够使用位姿图(pose-graph PG)优化或BA来重置漂移从而校正回环。是在大中型回环场景中,保证系统精度的关键。
ORBSLAM3的创新:
一种完全依赖最大后验概率(MAP)估计的单目和双目视觉惯性SLAM系统。即使在IMU(惯性测量单元)初始化阶段也是如此。 [6]中介绍了所提出的初始化方法。这里添加了它与ORB-SLAM视觉惯性[4]的集成,扩展到双目惯性slam。
高召回率位置识别。DBoW2实现位置识别需要时间一致性,在检查几何一致性之前,将三个连续的关键帧匹配到同一个区域,提高精度,在回环和重用以前的地图时速度太慢。故提出了一种新的位置识别算法:首先检查候选关键帧的几何一致性,然后检查与地图中已有的三个可共视关键帧的局部一致性。提高了召回率、数据关联和地图准确性,代价是计算成本稍高。
ORB-SLAM Atlas地图集。第一个用于单、双目能够处理视觉和视觉惯性的多地图SLAM系统。允许自动使用和组合在不同时间构建的地图,执行增量多会话SLAM。用视觉ORBSLAM地图集的初步版本见[10]。在这里我们添加了新的地点识别系统,视觉惯性多地图系统。
一种抽象的相机表示法。代码与所使用的相机模型无关,通过提供投影、反投影和雅可比函数来添加新相机模型。如针孔[11]和鱼眼[12]模型的实现。

II. RELATED WORK

A. Visual SLAM
MonoSLAM[13]、[14]、[53]中使用扩展Kalman滤波器(EKF)和ShiTomasi点进行相关引导搜索,然后在后续图像中跟踪这些点。中期数据关联显著的改进了特征匹配的一致性,实现了手持式视觉SLAM[54],[55]。
相比之下,基于关键帧的方法只使用少数选定帧来估计地图,忽略来自中间帧的信息。以关键帧率执行更昂贵但更精确的BA优化。最具代表性的是PTAM[16],将相机跟踪和建图分成两个平行线程。在相同的计算成本下,基于关键帧的技术比滤波更精确[56],成为视觉SLAM和VO的黄金标准。[57]中使用滑动窗口BA实现了大规模的单目SLAM,[58]中使用了双窗口优化和共视图。
ORB-SLAM[2],[3]使用ORB特征,其描述子提供短期和中期数据关联,构建共视图以限制跟踪和建图的复杂性,并使用词袋DBoW2[9]进行回环和重定位,实现长期数据关联。是迄今为止唯一集成了三种数据关联的视觉SLAM系统。我们使用新的地图集(Atlas)系统来提高它在纯视觉SLAM中的鲁棒性,并使用新的高召回率位置识别方法来提高它在回环场景中的准确性。
直接法使用图像中的像素强度,通过最小化光度误差来估计运动和空间结构。LSD-SLAM[20]能够使用高梯度像素构建大比例的半稠密地图(位姿图),其精度低于PTAM和ORB-SLAM[2]。混合系统SVO[23],[24]从帧到帧提取FAST特征,使用直接方法跟踪特征和具有非零强度梯度的像素,并使用重投影误差优化相机轨迹和结构,只执行短期的数据关联,限制了准确性。直接稀疏里程计DSO[27]能够在特征点探测不佳的情况下计算出精确的相机位姿,增强了低纹理区域或模糊图像的鲁棒性,引入了局部光度BA,同时优化了7个最近关键帧的窗口和点的逆深度,扩展到了双目[29]、使用特征和DBoW2[59][60]的回环闭合,以及视觉惯性里程计[46]。直接稀疏建图DSM[31]在直接方法中引入了地图重用的思想,说明了中期数据关联的重要性。
B. Visual-Inertial SLAM
视觉传感器和惯性传感器的结合提供了对不良纹理、运动模糊和遮挡的鲁棒性,并且在单目系统的情况下,使尺度可观察。
紧耦合方法的研究可以追溯到MSCKF[33],特征边缘化避免了特征数量上的EKF二次方代价计算,系统在[34]中得到完善,在[35]、[36]中扩展到双目。第一个基于关键帧和光束平差的紧耦合视觉里程计系统是OKVIS[38],[39],能够使用单目和双目视觉。ROVIO[41],[42]使用直接数据关联向EFK提供了光度误差。
ORB-SLAM-VI[4]首次提出了一种视觉惯性SLAM系统,能够重用三种数据关联的地图,

  • 2
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值