[2018]Mask-SLAM_ Robust feature-based monocular SLAM by masking using semantic segmentation

[2018]Mask-SLAM: Robust feature-based monocular SLAM by masking using semantic segmentation

1.作者

kaneko, iwami, t ogawa, yamasaki, aizawa

2.时间

2018

3.整体结构

解决的问题:如果图像的主要部分被移动的对象占据,许多特征点变得不可靠,并且RANSAC不能很好地完成。天空和汽车上的特征点通常会导致vSLAM中的错误。
解决的方法:使用语义分割产生的掩膜来排除特征点,排除掩膜区域中的特征点使vSLAM能够稳定地估计摄像机运动。

4.提出的算法

1.视觉SLAM


基于特征的VSLAM通常包括:(这两个过程同时执行)

  1. 定位即跟踪相机姿态估计
  2. 建图以重建周围的3D环境

ORB-SLAM是vSLAM的最先进的实现,它使用可以高速提取的ORB特征点,并比较这些ORB特征以获得对应点。ORB-SLAM利用获取大量对应对并从中选择可靠对的策略。RANSAC 是用于选择最可靠对应关系的算法。
RANSAC算法的操作如下:

  • 从数据中随机抽取足够数量的样本。
  • 估计一组参数来拟合这些样本,这组参数称为假设。
  • 将获得的假设应用于除提取样本之外的所有数据,并计算每个数据样本的估计参数之间的距离。
  • 将距离较小的样本视为内联样本,让内联样本的数量代表一个假设的正确性。
  • 以上操作执行多次,采用内联数最大的假设,剔除离群数据。

一般来说,在vSLAM中,RANSAC可以从大量对应关系中找到最正确的一对,并可以推导出准确的相机姿态。然而,这种方法也存在局限:

  • vSLAM需要静止物体的特征,以便RANSAC能够选择可靠的对应关系。当整个视图被移动的物体占据时,RANSAC不能选择可靠的对应关系。

因此,提出使用语义分割来弥补RANSAC的不足。语义分割用于产生一个掩码,以排除不可能找到正确对应的区域。具体而言,在一般的vSLAM系统中,在检测特征点的阶段,添加了“不检测掩蔽区域中的特征点”的操作。通过简单地增加这个操作,可以排除大部分获得的不准确的对应关系,这显著地减少了RANSAC误差.

2.语义分割


语义分割可以为图像的每一个像素分配一个标签。
文中定义的mask有如下几种:

  • 汽车:移动目标,不适合提取特征点。
  • 天空:距离相机很远,很难估计出准确的三维信息。

使用deeplabV2进行语义分割,deeplabV2的网络结构如下:

  • 对于输入图像,深度神经网络输出对象存在的概率热图。
  • 在概率热图上进行双线性插值。
  • 使用条件随机场进行边界细化,输出最终的分割结果。

在实验中,本文使用CARLA驾驶模拟器创建的3000张分辨率为800*600的图像,训练了一个基于ResNet101的网络模型

5.实验

1.数据集

为了证明所提出方法的有效性,我们使用了CARLA驾驶模拟器,它可以模拟各种环境。现有的基准,如KITTI,场景有限,RANSAC不太可能失败。然而由于现实世界中会出现各种各样的环境,仅使用KITTI基准来评估模型是不够的


在本实验中,我们从两个城镇(Town01,Town02)在15种天气条件下移动的汽车上获取图像,各创建了50个数据集,每个数据集包含1000幅图像(800 × 600像素),每秒15帧。汽车使用自动驾驶模式自动驾驶,每次行驶距离为100-500米。

2.评估指标

在检测vSLAM的性能时,通早会测量vSLAM估计轨迹与真实值之间的误差,但在实验中,关注的是vSLAM的整体改进。我们将改进定义为当原始vSLAM失去位置并停止运行时,vSLAM方法无问题运行。我们便用了以下两种评估指标:

  • 平均跟踪速率(MTR):vSLAM能否在不丢失其位置或按顺序停止的情况下进行跟踪。将"失败跟踪"定义为未能获得序列中1000帧中超过80%的估计结果,反之为"成功跟踪"。

  • 平均轨迹误差(MTE):一般vSLAM的目标是"估计接近真实值的相机轨迹"。我们输出每个时间步的距离误差和一个序列的平均值作为"轨迹误差[m]",作为对接近度的评价。注意我们只计算成功跟踪的误差。

3.实验结果



与ORB-SLAME比,我们的方法得到了较好的改善对于Video1,通过使用掩膜限制征检测区域。从整个视中提取特征点,估计结果趋于隐定。关于Video2,ORB_SLAM停止并丢失位置,因为汽车覆盖了整个视场。但是,在我们的方法中,使用掩膜成功地排除了汽车区域上的特征点,成功地跟踪了特征点。


Video3的天气是湿多云,时间为日落,且路上有水坑。由于跟踪建筑物轮廓在水中的镜像特征点,降低了vSLAM的估计精度。在我们的方法中,通过使用掩膜排除汽车和天空,与ORB-SLAM比,特征点更有可能在水坑区域被检测,因此误差更高。

6.结论

提出了一种新的基于特征的向量空间模型和语义分割相结合的方法。语义分割输出了将对象分类到图像中的语义区域的结果,我们从不适合vSLAM的语义区域生成了一个掩码。我们的vSLAM方法只从掩模排除的区域提取特征点,并且只能选择可靠的特征点。这使得vSLAM能够准确稳定地工作,而不会丢失其位置。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
### 回答1: ORB-SLAM2_with_semantic_label是一种基于ORB-SLAM2的视觉SLAM系统,它使用语义标签信息来增强场景理解和地图构建。该系统通过将每个地图点与语义标签相对应,从而为地图中的每个区域提供更多的上下文信息。这有助于提高系统的鲁棒性和场景理解能力,并可以在机器人导航、自动驾驶等领域得到广泛应用。 ### 回答2: ORB-SLAM2是一种视觉SLAM算法,可以实现从单个或多个摄像头的图像序列中实时重建3D地图,同时在该地图中定位相机。它广泛应用于机器人导航、增强现实、自动驾驶等领域。然而,在某些现实场景中,例如室内场景、城市环境等,只有3D地图是不够的,需要利用语义信息来更好地理解环境。 因此,ORB-SLAM2的研究人员进行了扩展,开发了一种ORB-SLAM2_with_semantic_label算法,以结合视觉SLAM和语义信息。该算法的目标是在ORB-SLAM2中增加对语义信息的支持,从而允许机器理解其所在环境中的物体及其特征。该算法的一个重要应用是在机器人导航中,机器人可以利用语义标签对其周围环境进行更准确、更可靠的理解,从而更好地规划路径。 该算法的关键步骤包括以下几个方面。首先,需要将语义分割模型与ORB-SLAM2进行集成,产生语义标记的地图,这可以在ORB-SLAM2映射初始化期间完成。其次,需要利用深度学习技术提取图像的语义特征,用于在传统视觉SLAM系统中增加语义信息。接着,需要将ORB-SLAM2中的回环检测模块改进,以考虑语义信息来消除误报。最后,需要使用机器学习算法,通过对特定环境中所遇到的物体的历史观测进行学习,从而使机器人能够在不同环境中尽可能准确地识别物体。 该算法的优点是可以在不增加太多计算量的情况下增加语义信息,从而使机器能够自然地与人类进行交互。但是,该算法的缺点是需要对语义标注数据进行精确的手动标注,这是一项非常耗时的任务。此外,该算法对光照和尺度变化非常敏感,因此在实际应用中需要特别注意。 ### 回答3: ORB-SLAM2是一种基于视觉SLAM技术的实时多目标跟踪和定位系统,它结合了ORB特征提取器和BoW词袋模型,使得系统具有高效的实时位姿估计能力。而ORB-SLAM2 with Semantic Label则是在ORB-SLAM2的基础上,加入了语义标签的支持。 语义标签是指对环境元素的分类标注,例如标注图像中的建筑、人、车等。加入语义标签的目的是提高系统对环境信息的理解和描述能力。在ORB-SLAM2 with Semantic Label中,可以通过在输入图像中标记语义标签信息,并将其存储到地图数据中,从而实现地图的语义化描述。同时,语义标签可以通过深度学习等技术来实现自动分类。 与传统的视觉SLAM系统相比,ORB-SLAM2 with Semantic Label可以更好地应对复杂的环境场景。在城市街道和室内场所等环境中,ORB-SLAM2 with Semantic Label可以对人、车辆和建筑等复杂元素进行识别,并在建立地图时,将这些语义信息一同存储在地图中。这样可以提供更为精确的地图信息,使得系统的位置估计更加准确、稳定。 总之,ORB-SLAM2 with Semantic Label是一种具有语义理解能力的SLAM系统,可以为机器人的自主导航和环境理解等方面的应用提供更为准确、可靠的基础支撑。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

火柴的初心

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值