点击上方“视学算法”,选择“星标”
干货第一时间送达
整理:公众号@智车科技
本文仅做学术分享,如有侵权,请联系删除。
这是一个arXiv上2020年6月底上传的综述“A Survey on Deep Learning for Localization and Mapping: Towards the Age of Spatial Machine Intelligence“,作者来自英国牛津大学,文章覆盖了odometry、mapping和SLAM等。
这是一个arXiv上2020年6月底上传的综述“A Survey on Deep Learning for Localization and Mapping: Towards the Age of Spatial Machine Intelligence“,作者来自英国牛津大学,文章覆盖了odometry、mapping和SLAM等。
如图给出了传统方法和学习方法的比较:X是传感器数据,Y是目标(运动、姿态和几何+语义等)。
关于深度学习在这个领域的应用,作者给出了如下的分类:
而这里给出综述的全貌,也是以上模块在所构成系统的相互关系图:
这是odometry的方法列表:分视觉、视觉-惯导和激光雷达三个类。
下面这张图告诉我们:非监督方法还是比监督方法误差大,深度学习和传统方法的混合精度不错。
这是mapping的方法列表:区别很大的在于地图表示,几何、语义以及同时包括几何和表观的表示。
定位模式分多种:2D-to-2D localization;2D-to-3D localization;3D-to-3D localization。
先看2D-2D定位:这里2D地图可以是显式地或者隐式(NN模型),如图所示。
如下表是对应的方法列表。
再说2D-3D定位方法:如图是一个示意图,特征描述匹配的基础上做PnP得到pose,而NN模型直接回归得到定位。
对应的方法列表如下。
最后一个3D-3D定位:主要是激光雷达点云数据而言。其示意图如下:CNN+RNN回归pose
方法列表如下。
SLAM技术,文章分成模块来讨论,即Local optimization,Global optimization ,Keyframe detection,Loop-closure detection 和 Uncertainty Estimation等。
列出方法如下表:
最后给出的Open problems:
End-to-end model vs. hybrid model:前者对数据要求太大,后者可以考虑一些priori知识。
Unifying evaluation benchmark and metric:目前只有Kitti比较公认的benchmark,感觉还是太不足了。
Real-world deployment:实时性要求,自监督和在线学习的能力。
Lifelong learning:可规模化和扩展性问题。
New sensors:一些没有重视的传感器,比如event camera, thermo camera, mmwave device, radio signals, magnetic sensor等等。
Scalability:更大的环境,比如郊区、室外等等。
Safety, reliability and interpretability:目前DL应用都关心的问题,AI的不确定性、自动驾驶的安全性以及NN模型的可解释性。
本文仅做学术分享,如有侵权,请联系删文