[论文笔记]Probabilistic data association for semantic slam

最新推荐文章于 2021-08-19 12:36:28 发布

KylinQAQ

最新推荐文章于 2021-08-19 12:36:28 发布

阅读量2.2k

点赞数 2

分类专栏： SLAM 论文笔记文章标签：语义slam

本文链接：https://blog.csdn.net/pikachu_777/article/details/86631256

版权

本文探讨如何将数据关联与语义类别相结合，以改进SLAM中的位姿估计。通过引入数据关联概率，结合惯性、几何和语义信息，形成统一的优化框架。文章详细介绍了三种解决数据关联的方法，包括使用EM算法优化位姿、路标点和数据关联，以解决传统SLAM中数据关联和回环检测的问题。语义SLAM利用类别信息改进了数据关联，增强了系统的鲁棒性和精度。

摘要由CSDN通过智能技术生成

1. introduction

读完总结，感觉这篇文章的主要思想是，提出数据关联，并根据语义的类别结果计算数据关联的概率，然后在优化过程中，根据之前的数据关联作为概率权重，引入与目标检测位置有关的误差项，从而让目标检测来辅助位姿估计。

数据关联和识别问题是不同类别之间离散的，而传统SLAM是连续优化的。

本文的目标是利用目标检测，整合尺度(metric)信息和语义(semantic)信息，用于传感器位姿估计和地图点位置估计。具有语义标签的路标点能够用于解决传统几何SLAM的两个问题：一是数据关联问题，即匹配传感器的观测与路标。二是回环检测，即用于识别之前已经去过的地方。

传统基于位姿图的非线性优化方法，依赖于运动模型和观测模型的线性化，而对于离散的目标检测结果，这就成为了一个问题。

本文的贡献如下：

紧密结合了惯性传感器、几何信息、语义观测，于一个单独的优化框架之中。
对于联合的尺度-语义SLAM问题，将其分解为两个子问题：连续的位姿优化问题，离散的数据关联和语义标签优化问题。

2. probabilistic data association in SLAM

文章给了一个SLAM问题的定义：

拥有一组地图点： $L=\{l_m\}_{m=1}^{M}$

一组传感器观测： $Z=\{z_k\}_{k=1}^{K}$

一组相机位姿： $X=\{x_t\}_{t=1}^{T}$

一组数据关联： $D=\{(\alpha_k,\beta_k)\}_{k=1}^{K}$

这里数据关联表示，在第k个观测下，从位姿 $x_{\alpha _k}$ 观测到路标点 $l_{\beta_k}$ 。正常情况下这个从哪能观测到什么是不知道的，比如我从某个观测k的位姿上观测，可能观测到椅子的一个点，也可能观测到杯子的一个点。感觉这里把位姿和观测联想在一起会容易理解一点，观测是在不同位姿下进行的，而它所能观测到的物体是不确定的。这里数据关联和地图点坐标、相机位姿一样，也是待优化的随机变量。

传统SLAM是估计地图点的位姿和相机位姿，但没有考虑数据关联。引入数据关联后，SLAM问题就变成：

$x,l,d=argmax_{x,l,d}logp(z|x,l,d)$

文章提出了三种求解方法:

第一种是分为两步：

$D'=argmax_D p(D|X^{0},L^{0},z)$

$X',L'=argmax_{X,L} logp(Z|X,L,D')$

即先根据初始的位姿和路标以及观测，求出数据关联的最优值，再把这个求出的数据关联当作已知条件，求出路标和位姿的最优值。

比如，先根据初始的位姿和路标，确定观测到的是椅子的点还是桌子的点，从而根据椅子或桌子在地图种的位置，来估计相机位姿。

这种方法存在的问题是，如果估计错了数据关联，则对后续的位姿和路标点估计影响很大。同时，模糊的观测会被舍去，以避免错误的数据关联估计，那这些信息就完全无法发挥作用了。

第二种方法解决了第一个问题，它采用迭代的坐标下降法：

$D^{i+1}=argmax_D p(D|x^{i},L^{i},Z)$

$x^{i+1},L^{i+1}=argmax_{X,L}logp(Z|X,L,D^{i+1})$

最低0.47元/天解锁文章

KylinQAQ

关注

2
点赞
踩
10

收藏

觉得还不错? 一键收藏
1
评论
[论文笔记]Probabilistic data association for semantic slam

1. introduction读完总结，感觉这篇文章的主要思想是，提出数据关联，并根据语义的类别结果计算数据关联的概率，然后在优化过程中，根据之前的数据关联作为概率权重，引入与目标检测位置有关的误差项，从而让目标检测来辅助位姿估计。数据关联和识别问题是不同类别之间离散的，而传统SLAM是连续优化的。本文的目标是利用目标检测，整合尺度(metric)信息和语义(semantic)信息，用于传感...
复制链接

扫一扫