StaticFusion

主要内容

面向动态环境基于面元的RGB-D SLAM系统,主要内容如下:

  • 同时估计RGB-D相机位姿并分割当前帧图片中的静态像素。将当前帧像素的静态概率当做一个取值范围为 [公式] 的连续变量,和位姿一起联合优化。
  • 构建静态场景的面元地图。为此,地图中的每个面元添加额外的生存能力项,由对应观测像素的静态概率决定。如果生存能力过小,则表明该面元属于动态面元,从地图中移除该面元。
  • 代码地址:raluca-scona/staticfusion

缺点

  • 初始若干帧内不能有大量动态物体,这样才能保证初始静态场景面元地图的准确性。

摘要

动态环境对于视觉SLAM是有挑战性的因为运动物体能够损害相机位姿跟踪并且导致地图的损坏。在本文中,我们提出一种动态环境中的鲁棒RGB-D SLAM方法,检测运动物体同时重建背景结构。大多数方法采用隐式的鲁棒惩罚项或者外点滤除技术来处理运动物体,我们的方法是同时估计相机运动和当前RGB-D相机对的静态概率/动态分割。该分割被用于加权稠密RGB-D融合来估计环境纯静态部分的3D模型。通过利用3D模型用于帧-模型对齐,同时静态/动态分割,相机运动估计降低了漂移——同时对场景中的动态元素更鲁棒。证实被提供,比较了提出的方法和相关的SOTA方法,使用静态和动态序列。提出的方法达到了相似的表现在静态环境中,和提高的精度和鲁棒性在动态序列中。

R. Scona, M. Jaimez, Y. R. Petillot, M. Fallon, and D. Cremers. StaticFusion: Background Reconstruction for dense RGB-D SLAM in Dynamic Environments. IEEE International Conference on Robotics and Automation, 3849-3856, 2018.

1 介绍

SOTA稠密视觉SLAM方法能够产生大型室内场景中令人印象深刻的重建。这些方法,然而,经常依赖环境是静态的假设,相机运动平滑并且场景中有充分的几何或纹理用于可靠的跟踪。我们专注于静态场景的假设。动态环境中的鲁棒操作是一个开放性问题。例如,大多数里程计方法执行当前图片和之前参考之间的配准,同时假设图片间被估计的变换是由相机运动导致的。动态元素然乱了该假设,并且可能导致位姿跟踪中的失败。此外,如果没有主动监测和分割,动态物体可能被融合到地图中,其可能导致不可逆转的损害。

提高SLAM在动态环境中的表现是特别重要的问题对于移动机器人来说。机器人很少在纯静态环境中操作,这种需求将会严重限制部署的范围。在示例应用中,协作机器人例如Rethink Baxter执行任务在运动的设备和装置之间。移动服务机器人面对类似的挑战,因为它们的环境被人类占据。

我们解决上述问题通过联合估计RGB-D相机的运动同时分割场景为静态和动态部分。相机运动被计算通过对齐即将到来的帧和环境的稠密面元模型(类似ElasticFusion[1])。分解静态和运动部分导致了一个仅包含静态元素的静态背景。

运动物体的有效的检测和分割一般需要时序反馈或者多帧构架。我们证实背景3D重建是一个高效的方式来传播这种时序信息不需要引入巨大的时间消耗。同时,场景中的结果地图更有意义,因为它仅包含场景中的结构化元素和静态物体。

本文贡献如下:

  • 一个新构架,同时估计相机运动并分割当前帧中的静态物体
  • 一个稠密建图系统,仅融合时序一致的数据(即,它存储过去静态的信息)。
  • 大量的评估,证实了提出的算法在动态环境中超过了SOTA解决方案,并达到了具有竞争力的运行时间(30ms/帧)。

2 相关工作

室内环境中的稠密视觉SLAM已经取得了巨大进步通过消费级3D相机的出现例如微软Kinect或者Asus Xtion。该领域的一个开创性工作是KinectFusion[2],首个使用RGB-D数据执行实时稠密跟踪和数据融合的系统。该方法使用一个固定大小的体素表示组合在GPU上。后续研究提供了令人印象深刻的表现,扩展范围[3][4],回环能力[5][6]为了保证3D扫描和建图更大的室内场景变得更鲁棒和容易使用。

虽然大多数现存方法专注于扫描静态环境,还有为了增加动态场景的鲁棒性做出的特殊努力。

动态元素的隐式处理:使用鲁棒代价函数很常见在视觉里程计前端中,其惩罚高残差点的贡献,隐式增加了位姿估计的鲁棒性。Gutierrez等人[9]比较了不同的鲁棒函数专注于位姿估计的质量,同时Kerl等人[10][8]证实了小运动物体的鲁棒性。这些解决方案是不足够的或者会失败当运动部分占据图片的很大一部分时。

专注重建的方法,例如ElasticFusion[1]和Keller等人的方法[4],需要点在连续帧中被重复观测到,在整合到3D模型中之前。类似地,在这些方法中,动态元素不会显式的被检测和处理,导致鲁棒性限制在小运动场景。

外点拒绝策略:一个常见处理动态物体的策略是检测和滤除噪声点。

对于Keller等人[4],没有较近模型点对应的输入点被用于区域生长过程的种子点来分割当前图片为静态和动态部分。接着,与动态输入点匹配的模型点从重建中被移除。这种方法只有在对场景进行了有信心的重建之后才是有效的。

在DTAM中[11](单目稠密建图系统),作者抛弃了光度误差大于某个特定阈值的像素。对于ORB-SLAM[12][13],作者强制一个有效的最适生存策略,判断关键帧和用于位姿跟踪的点的合法性。通过宽进严出的策略,他们证实了令人印象深刻的鲁棒性和多功能性。

然而,在这些方法中,没有时间或空间一致性被强制在连续帧中被检测的动态点之间。

强制空间和时间一致性:Jaimez等人[14]介绍了一而终联合视觉里程计和场景流估计方法。类似的,BaMVO[15]是一个里程计方法,重建前4帧的环境通过时序传播。二者都是帧-帧方法,它们引入了随着时间的无界漂移,并对于图片中大部分被动态占据的情形中不有效。Runz等人[16]提出了一个方法,重建和跟踪每个运动物体通过单独的3D模型,是首个实时执行稠密重建和多物体融合的方法,显式处理动态元素,并强制空间和时间一致性。

最终,可能通过使用运动先验例如IMU[17]或者机器人里程计[18]来增加视觉SLAM在动态环境中的鲁棒性&#

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值