文献阅读|Dynamic-SLAM

点击上方“3D视觉工坊”,选择“星标”

干货第一时间送达

本文由知乎作者HectoorZ授权转载,不得擅自二次转载。原文链接:https://zhuanlan.zhihu.com/p/128472528

前言

论文原文:Semantic monocular visual localization and mapping based on deep learning in dynamic environment 在动态环境中工作时,由于动态对象的干扰,传统的SLAM框架的性能很差。通过在对象检测中利用深度学习的优势,提出了一种语义动态的动态地图定位和映射框架Dynamic-SLAM,以解决动态环境中的SLAM问题。

本文的主要三大贡献:

1. 针对SLAM系统提出了一种基于相邻帧速度不变性的丢失检测补偿算法,提高SSD的recall rate,为后续模块提供了良好的依据。

2. 提出了一种选择跟踪算法,以一种简单有效的方式消除动态对象,提高了系统的鲁棒性和准确性。

3. 构建了基于特征的可视化动态SLAM系统。构建了基于SSD的目标检测模块线程,并将其检测结果作为先验知识提升SLAM性能。

主要希望解决问题:动态环境下的SLAM。

Missed detection compensation algorithm(漏检补偿算法)

传统目标检测任务无法通过上下文信息来提高检测精度。但SLAM中,视频帧按时间顺序到达时,检测结果将以柔和的方式扫描到先前的帧中,从而预测下一个检测结果,从而避免丢失或丢失。 对于SLAMIDE问题中的动态对象检测任务,Recall rate更加重要。

模型基于以下合理假设:动态对象的运动速度在短时间内趋于保持恒定(即加速度趋于0)。用$v$表示动态物体的速度,用$a_{max}$表示像素平面中动态物体速度变化率的阈值。那么有以下关系:

先前帧和当前帧之间的相应边界框可以通过$∆v$确认,也就是说可以预测上一帧物体在当前帧的位置。下面的$^Ka_i$就表示预测的物体center位置,由上一帧物体位置+前几帧该物体位移的平均值+容错阈值 组成。$^K\hat{c}$表示物体最后估计的center,也就是漏检补偿的坐标,由上一帧物体位置+前几帧该物体位移平均值组成。

算法:已知SSD会输出检测物体的list,那么遍历当前帧中上一帧出现过得物体list,预测这些物体在当前帧的bbx位置,再遍历当前帧所有的bounding box是否有被预测框包含,如果有则说明在这一帧被检测到了,如果没有表示没有检测到,那么就把这个物体加上。

效果:

Seletive Tracking Method(选择跟踪算法)

作用:不提取/少提取有dynamic object 的特征点,减少Bundle Adjustment求解的误差。

作者提出把一些常见动态物体打分,但是后面似乎没有说到要用到这个分值。

SLAM执行特征点采集匹配后,往往会执行pnp求出pose的初值,然后再用BA最小化重投影误差:

Dynamic-SLAM中,把动态物体区域(Mask)设为1,非动态物体区域设为0:

核心在于以下式子,13式是计算静态点的平均位移,12式是计算动态点的位移是否超过 静态点的平均位移×阈值,如果超过了就说明这个动态点在移动,不适合作为BA求解的一份子,剔除该特征点。

整体算法如下:遍历当前帧的特征点,计算静态点的平均位移。如果是动态点,就看它是否小于所有静态点的平均位移(这里还要×一个系数),以此来判断这个动态点是否在动。

效果如下:

总结

这篇论文是我第一篇看的语义slam,之前听很多人推荐过(估计是因为开源的缘故?),他的侧重点不在于建图,而在于使SLAM更加精确,消除了部分动态物体对pose求解造成的影响。相对于其他理论算法的提升,似乎深度学习+SLAM的搭配更加容易,但后续还会再看看类似的领域看有没有更加创新的思维。

上述内容,如有侵犯版权,请联系作者,会自行删文。

推荐阅读:

吐血整理|3D视觉系统化学习路线

那些精贵的3D视觉系统学习资源总结(附书籍、网址与视频教程)

超全的3D视觉数据集汇总

大盘点|6D姿态估计算法汇总(上)

大盘点|6D姿态估计算法汇总(下)

机器人抓取汇总|涉及目标检测、分割、姿态识别、抓取点检测、路径规划

汇总|3D点云目标检测算法

汇总|3D人脸重建算法

那些年,我们一起刷过的计算机视觉比赛

总结|深度学习实现缺陷检测

深度学习在3-D环境重建中的应用

汇总|医学图像分析领域论文

大盘点|OCR算法汇总

重磅!3DCVer-知识星球和学术交流群已成立

3D视觉从入门到精通知识星球:针对3D视觉领域的知识点汇总、入门进阶学习路线、最新paper分享、疑问解答四个方面进行深耕,更有各类大厂的算法工程人员进行技术指导,820+的星球成员为创造更好的AI世界共同进步,知识星球入口:

学习3D视觉核心技术,扫描查看介绍,3天内无条件退款

 圈里有高质量教程资料、可答疑解惑、助你高效解决问题

欢迎加入我们公众号读者群一起和同行交流,目前有3D视觉CV&深度学习SLAM三维重建点云后处理自动驾驶、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流等微信群,请扫描下面微信号加群,备注:”研究方向+学校/公司+昵称“,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进去相关微信群。原创投稿也请联系。

▲长按加群或投稿

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值