[2022]DyOb-SLAM : Dynamic Object Tracking SLAM System

火柴的初心

于 2023-06-21 10:44:38 发布

阅读量612

点赞数 2

分类专栏： # 动态SLAM 文章标签：深度学习人工智能机器学习 SLAM 自动驾驶计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/He3he3he/article/details/131217932

版权

动态SLAM 专栏收录该内容

10 篇文章

订阅专栏

DyOb-SLAM结合了DynaSLAM和VDO-SLAM，利用MaskRCNN进行目标检测，PWC-Net估算光流进行跟踪。系统通过ORB特征和静态点的BA优化构建稀疏地图，同时跟踪并更新动态目标的运动状态。后端优化包括局部和全局BA，部分计算密集型任务如语义分割可迁移到云端。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1.作者

Rushmian Annoy Wadud、Wei Sun

2.时间

3.整体架构

在这里插入图片描述
DyOb-SLAM是DynaSLAM和VDO-SLAM的结合:

基于先验信息使用Mask RCNN分割出动态目标
通过基于光流和场景流的算法对运动目标进行跟踪
对静态点进行BA优化

输出：

当前帧显示ORB特征以及Masj信息和对象标签
基于静态特征的稀疏地图
包含动态目标及其随时间更新的运动的全局地图

4.中心思想

1.目标检测

Mask-RCNN被用来分割出当前帧的潜在运动目标
稠密光流：使用PWC-Net，有助于最大化跟踪点的数量，然后用于跟踪多个对象

2.跟踪

跟踪的输入是RGB图像、每帧的深度信息、分割Mask和光流信息，其分为 3 个模块：

ORB特征提取：采用ORB_SLAM2中提出的
相机位姿估计：使用静态的点最小化重投影误差进行相机位姿估计

$e\left(X_{k}\right)=C_{k}-\pi\left(X_{k}^{-1} P_{k-1}\right)$

目标运动跟踪：使用场景流更新动态目标的分割信息，对于场景流的话，静态目标的场景流理论上为0，因此可以用一个阈值来判断目标是运动的还是静止的
目标位姿估计： $P_{k} =^{k-1}O_{k}P_{k-1}$
- 目标的运动： $^{k-1}O_{k}$
- $P_{k}$ ：第K帧静止的点
- $P_{k-1}$ ：第K-1帧静止的点
- 在全局参考帧中的目标点和图像帧中的静止点的重投影误差： $e\left({ }^{k-1} O_{k}\right)=C_{k}-\pi\left(X_{k}{ }^{-1}\left[{ }^{k-1} O_{k}\right] P_{k-1}\right)$
- 速度的差： $E =v_{g}-v_{e}$

3.建图

稀疏地图：由静止背景上的特征点三角化生成的稀疏点云

在这里插入图片描述

全局地图：相机的位姿信息与目标的运动

在这里插入图片描述

4.后端

BA：关键帧和稀疏的地图点（局部+全局）
局部的batch优化：对于局部地图，最小化重投影误差优化相机的位姿
全局的batch优化：对于全局地图，最小化位姿误差优化相机和运动目标的位姿

5.云计算

将耗费计算资源的模块放到云端，比如语义分割

5.结果

在这里插入图片描述

火柴的初心

博客等级

码龄7年

123
原创

677
点赞

3697
收藏

1万+
粉丝

关注

私信

热门文章

分类专栏

SLAM三方库付费 2篇
ORB_SLAM3_源码解析 20篇
VINS 4篇
SLAM 1篇
2D激光SLAM 3篇
动态SLAM 10篇
VSLAM论文 3篇
环境配置 11篇
无人驾驶 5篇
点云 1篇
双目视觉 9篇
LeetCode 算法 5篇
图像处理 13篇
深度学习 4篇
ROS 15篇
树莓派 3篇
linux （ubuntu） 4篇
arm 1篇
c++ 16篇
其他 2篇

最新评论

SG-SLAM: A Real-Time RGB-D Visual SLAM Toward Dynamic Scenes With Semantic and Geometric Information
2301_79749294: 最后那些轨迹图是怎么画的！求教
双目视觉（七）稀疏双目匹配
wxlw55555: 有python代码吗
双目视觉（二）双目匹配的困难和评判标准
nothingspecial34: https://blog.csdn.net/qq_42676511/article/details/118684798，这里面有离线的测评代码，需要你去middlebury官网下载左右图像和理想的视差图，也就是数据集，然后就可以使用左右图像计算你想测评算法计算的视差图，和下载的标准视差图通过代码对比，计算误匹配率，除了全部视差图对比误匹配率，有的数据集提供非遮挡区域也可以计算误匹配率，有基础的话你应该会懂，没有基础的话先看看双目视觉的视差和误匹配率概念，看看李迎松博士的sgbm ad-census博客
双目视觉（二）双目匹配的困难和评判标准
瑶一瑶YY: 你好，请问你知道怎么下载这些图片了吗，我也遇到这个问题了，可以分享一下吗
双目视觉（二）双目匹配的困难和评判标准
m0_70843188: 您好，哥，能教一下怎么做的吗

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

火柴的初心 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。