slam十四讲第二版 pdf_视觉SLAM十四讲|第10讲后端1

最新推荐文章于 2022-11-23 17:57:00 发布

weixin_39603995

最新推荐文章于 2022-11-23 17:57:00 发布

阅读量657

点赞数

文章标签： slam十四讲第二版 pdf

咸鱼了好久。。。。起来接着学习。

上来就又被先验后验搞蒙了，重新理解一下：

先验概率：根据以往经验和分析得到的概率，它往往作为“由因求果”问题中的“因”出现。
后验概率：指在得到“结果”的信息后重新修正的概率，是“执果寻因”问题中的“因”。

最大的区别就在于结果/当前观测在后验概率中已知，在先验概率中未知。

1. 后端要做什么？

前端能够根据相邻的两幅图像判断出此时此刻的位姿，是暂时的；那么后端需要对前端测量以及计算的结果进行矫正，不仅用过去的信息，也用未来的信息更新自己，希望能够得到一个长时间的正确状态。

前面有讲过，在运动方程和观测方程中，如果把位姿和路标看成随机变量，就可以把问题变为已知观测数据和运动数据情况下，如何确定状态量的分布问题，是一个状态估计问题。假设噪声和状态量服从高斯分布，只需要估计它的均值和方差，即可确定状态量的分布。

完成后端优化可以使用滤波器，也可以使用非线性优化，本讲对两种方法都做了推导。

2. 滤波器推导

先做一些符号的定义和铺垫：

把位姿和路标写在一起，记为：

，用新符号写运动方程和观测方程，为：

。

需要求解的是后验概率问题，即在已知0时刻的状态、1:k时刻的观测下，k时刻的状态分布，写为

，根据贝叶斯法则，将后验概率展开为似然和先验概率的乘积，写为

。

先验概率中k时刻的状态

受到前面0:k-1时刻状态的影响，对先验概率进行展开，可以写为

，在进行滤波器模型推导时，假设马尔可夫性（k时刻状态只与k-1时刻状态有关，与之前状态无关）。可以根据马尔可夫性对先验概率的展开式进行化简，积分中第一个概率化简为

，第二个概率化简为

（运动方程中k时刻状态只受到k-1时刻的状态和k时刻的运动数据相关）。

2.1 卡尔曼滤波器（线性高斯系统）

在线性高斯系统中，用线性方程描述运动方程和观测方程，写为

，记噪声服从零均值高斯分布：

，令

表示后验，

表示先验。

因为各随机变量服从高斯分布，误差服从零均值高斯分布，根据高斯分布的特性（后面解释）和观测方程、运动方程，可以分别写出似然和先验的分布：

把先验均值和方差记为

根据后验、似然、先验的关系，有：

高斯分布底数为e，比较等式两边的指数项（不考虑常数项）有，

比较两边的系数，经过一系列推导可以得到后验均值和方差的表达式。

整个卡尔曼滤波的过程为：

在第一步预测中，使用k-1时刻的后验分布估计k时刻的先验分布，这一步不确定性变大，第二步使用k时刻的先验分布估计k时刻的后验分布，对于结果进行修正，缩小不确定性。

2.2 拓展卡尔曼滤波器EKF（非线性系统）

将线性系统拓展到非线性系统，通常会在某个点处对方程进行展开，保留一阶项，按照线性系统进行推导。

对于k时刻的运动方程，展开有：

，记偏导数为

。

对于k时刻的观测方程，展开有：

，记偏导数为

。

利用和线性系统类似的方法，推导得到预测步骤（没看明白怎么推的，如有大神请帮忙解释一下）：

卡尔曼增益：

更新步骤：

EKF的局限性：马尔可夫假设、一次线性化，这两个数学上的处理化简了问题，但是偏离了实际情况。记录均值、方差、路标等信息，存储量大。

3. 非线性优化（BA与图优化）

Bundle Adjustment，是指从视觉重建中提炼出最优的3D模型和相机参数（内参数和外参数）。

3.1 优化目标

回顾整个投影过程，假设已知相机的外参数（R，t）和世界坐标系的p点坐标，求解p点的像素坐标过程。

世界坐标转化为相机坐标：

相机坐标投影到归一化平面：

去畸变（径向畸变）：

计算像素坐标：

整个过程中，用到了相机的位姿（R，t）和路标p的世界坐标，得到了路标的像素坐标，对应到观测方程z=h(x,y)中，观测z就是像素坐标

，相机位姿x用李代数表示

，路标y用三维点p的坐标。那么通过降低观测到的像素坐标z和估计到的像素坐标

之间的误差，就可以得到最优的x和y的解。用最小二乘表示整体的代价函数为：

采用非线性优化更新增量的方式求解，令

，

。

引入增量后，目标函数变为：

表示f(x)对于相机位姿的偏导数，

表示f(x)对于路标点位置的偏导数。

接下来使用第六章的非线性优化方法进行求解，在求解时不免要计算

，利用H矩阵的稀疏性能够加速求解。

3.2 稀疏性

在高斯牛顿法中

，在列文伯格——马夸尔特方法中

，所以H的稀疏性主要是由J引起的。

对于代价函数中的

，描述的是在

看到

，只与这两个量相关，所以

由于

，J只在i和j处有非零块，所以矩阵H中只有(i,i),(i,j),(j,i),(j,j)处有非零块，其中i是相机部分，j是路标部分。

举例说明，假设有2个相机位姿

和6个路标

，那么相机所对应的变量有

，路标对应变量有

。如图10-4所示，连线表示相机可以看到路标。

图10-4的场景，用目标函数表示应该是：

其中

描述的是相机

观测到了

，把所有变量按照

的顺序摆放，则雅各比矩阵为

，依次推类可以得到目标函数每一项的雅各比矩阵，叠放在一起，用方块表示非零块，则矩阵J和H的非零值如图10-6所示。

每个非零块都对应着相机和路标点的关系，拓展开来，可以把H矩阵划分成四个区域，如图10-9所示。

其中BC是对角块矩阵，B的对角块与相机位姿的维度相同，C的对角块与路标维度相同，E的数值和具体的观测相关。

3.3 边缘化（Marginalization）

把相机位姿变量放到一起，记为

，把空间点的变量放在一起，记为

。

在非线性优化中，需要根据

求解增量，用分块矩阵表示H后变为：

，需要想办法计算两个增量。

先消去右上角的E：

，

整理得到

，

用第一行计算出

的值，再带入第二行，求解

，这个过程称为Marginalization。

3.4 鲁棒核函数

当输入的数据存在无匹配时，误差会很大，在二范式中产生的梯度也会很大，从而导致增量朝着错误的方向变化。选用一个具有光滑性质并且变化较小的函数可以使得系统更稳健，这种函数称为鲁棒核函数，比如Huber核：

。

附录A.3

高斯函数性质：

对于随机变量

，若有

，其中A，b为线性变量的稀疏矩阵核偏移量，w为噪声项，且

，有

。

参考文献

[1] 《视觉SLAM十四讲从理论到实践》高翔，张涛

weixin_39603995

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
slam十四讲第二版 pdf_视觉SLAM十四讲|第10讲后端1

咸鱼了好久。。。。起来接着学习。上来就又被先验后验搞蒙了，重新理解一下：先验概率：根据以往经验和分析得到的概率，它往往作为“由因求果”问题中的“因”出现。后验概率：指在得到“结果”的信息后重新修正的概率，是“执果寻因”问题中的“因”。最大的区别就在于结果/当前观测在后验概率中已知，在先验概率中未知。1. 后端要做什么？前端能够根据相邻的两幅图像判断出此时此刻的位姿，是暂时的；那么后端需要对前端测量...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。