DSP-SLAM-Object Oriented SLAM with Deep Shape Priors:
本文提出的DSP-SLAM是一个面向对象的SLAM系统,可以在单目、双立目或双目+激光雷达三种输入模式下以10帧/秒的速度进行工作。
其先利用基于特征的SLAM系统(如ORB-SLAM2)进行三维点云重建,双目+激光雷达系统利用ORB-SLAM2作为SLAM主干网,将重建的三维点云作为输入,该方法通过语义实例分割来检测对象,利用类别特定深度形状嵌入作为先验,通过一种新的二阶优化方法来估计对象的形状和姿态。通过利用对象形状先验,为前景对象构建了一个丰富而精确的稠密3D模型的联合地图。在物体形状和姿势估计方面,在定量和定性上改进了自动标记,这是一种最先进的基于先验知识的物体重建方法。另外,地图还用稀疏的地标点来表示背景环境。在联合因子图中对其进行优化,将基于特征的方法和对象感知SLAM(高级语义地图)的最佳特性结合起来。
与之类似的Node-SLAM也在实时SLAM系统中纳入了形状先验知识,但它使用稠密的深度图像进行形状优化,而DSP-SLAM可以仅使用RGB单目图像流进行计算,并且每个对象只需要50个3D点即可获得准确的形状估计。尽管FroDO和DSP-SLAM都可以在单目RGB设置下运行,但FroDO是一种缓慢的批量方法,需要提前获取所有帧并与它们的相机姿态关联,而DSP-SLAM是一种在线、连续的方法,可以每秒运行10帧。