Online Object Detection and Localization on Stereo Visual SLAM System【Journal of Intelligent & Robotic Systems (2020) 98:377–386】
摘要:
为了在未知环境中导航,自主机器人必须能够在周围环境中绘制周围环境的地图 同时估算其位置。此问题称为SLAM。我们提出了用于立体摄像机的SLAM系统 在场景中建立对象的地图。该系统基于SLAM方法S-PTAM和目标检测模块。对象检测模块使用深度学习进行在线检测并提供3D姿势估计输入图像中存在的物体的数量,而S-PTAM实时估计相机的姿势。该系统在真实环境中进行了测试,实现了良好的对象定位效果。
原文链接
核心模块:
1 RCNN Module (Object Detection)
使用Faster RCNN 对目标进行分割
上图为Faster Rcnn 模型的大致流程,使用了RPN网络和卷积网络交替训练的方法找到感兴趣的区域ROI。 该文作者在绿色框里对姿态回归使用了和RCNN一样的方法(两个全链接层加上ReLU 和dropout)
关于RCNN等模型在我的另一篇博文里 有详细的描述
RCNN的详细描述
下面是论文原文中对这个方法的描述
In the figure, Con