【视觉SLAM入门】4.1. 从状态估计到非线性最小二乘推演------状态估计，最大后验，最大似然，最小二乘，高维高斯分布，非线性优化推导

终问鼎

已于 2023-07-28 10:48:28 修改

阅读量372

点赞数

分类专栏：自动驾驶-SLAM # VSLAM 文章标签：算法线性回归 SLAM 贝叶斯公式概率论最大似然

于 2023-07-10 21:53:25 首次发布

本文链接：https://blog.csdn.net/Eric_Sober/article/details/131639927

版权

自动驾驶-SLAM 同时被 2 个专栏收录

37 篇文章 23 订阅

订阅专栏

VSLAM

16 篇文章 1 订阅

订阅专栏

注意： 本节及下一节，我们将会围绕该问题展开---- $\color {red}噪声中恢复数据进行视觉SLAM$

0. 引入

$\;\;\;$ 至此，(视觉)理想且经典的SLAM问题已经弄清楚了
$\;\;\;$ 之前SLAM的运动和观测都是基于理想情况下的，实际中我们要做的是在噪声数据中恢复理想情况的数据，由于同一时刻观测到不同的点且同一点会被观测多次，这为我们带来了更多约束，便于我们进行下来的任务—在实际的噪声环境中考虑SLAM任务。

1. 状态估计

带有顺序的推导，请顺序观看。

$\quad$ 只有图像没有运动传感器时，仅考虑观测方程。
$z_{k,j} = h(y_j, x_k)+v_{k,j}\qquad 这里设噪声v符合高斯分布 \;v_k \in N(0,Q_{k,j}) \\\quad\\x=\begin{Bmatrix}x_1,...,x_N,y_1,...,y_M\end{Bmatrix}\qquad “状态变量”：要估计的量即位姿和实际点坐标$
构成一个三维重建中的SFM(Structrue from motion)问题,我们要做的是实时求解SFM问题而已(在多张知道时间先后顺序的图片中恢复结构(这里就是恢复地图点(当然，你知道我说的是世界坐标系下)))，问题转换为如下：
$u)\overset{无运动传感器,无u}{=}\color{red}P(x|z) \overset{贝叶斯}{=}\frac{P(z|x)P(x)}{P(z)} \color{b}\overset{分母和和待估计状态无关}{\propto}P(z|x)P(x) \\$
红色部分就是贝叶斯公式，它描述的是 “用数据来修正先验得到后验概率的过程”。简单说一下:

$P (x ∣ z)$ ：后验概率， $\quad P(z|x)$ :似然， $\quad P(x)$ ：先验

我们要求的问题则为(观测数据已知)：

$\color{red}x^*_{MAP} \color{b}= argmax\;P(x|z) = argmax\;P(x|z)P(x)$
$\quad$ 这就是最大后验概率：求一个状态最优估计(等式右边)，使得在该状态下，后验概率(等式左)最大化 (Maximize a Posterior, MAP)

而实际中，机器人的位姿大概位置也不知道(没有先验)，则上式变为求解：

$\color{red}x^*_{MLE}\color{b}=argmax \; P(z|x)$
$\quad$ 这就是最大似然估计(Maximize Likelihood Estimation, MLE): 没有先验的时候，即 $\;x$ 也未知。

$\quad$ 直观上看该问题：观测数据已知的时候，在什么样的状态下，最有可能产生现在观测到的数据

这篇文章讲贝叶斯和最大似然这些东西比较通俗易懂，不会的可以看一下，本身也比较简单，只是讲清楚比较麻烦。

2. 具体求解状态估计==>最小二乘引出

前边假设误差符合高斯，则实际上运动方程符合高维高斯分布，那么上边的最大似然也符合，即:
$P(z_{j,k}|x_k,y_j) \overset{符合高斯分布}{=} N(h(y_j,x_k),Q_{k,j})\qquad$

其中的 $h(y_j,x_k)$ 是运动方程中的理想情况即高斯理想均值， $Q_{k,j}$ 是运动方程中的误差项，但是高维。

首先回忆一下高维高斯分布吧：概率密度函数如下( $\Sigma称为协方差矩阵$ )：
$\frac{1}{\sqrt {(2\pi)^N \cdot det(\Sigma)}}exp(-\frac{1}{2}(x-\mu)^T\Sigma^{-1}(x-\mu))$
求解该高斯问题的最大值，一般最小化负对数
$\frac{1}{2}ln((2\pi)^N \cdot det(\Sigma))+\frac{1}{2}(x-\mu)^T\Sigma^{-1}(x-\mu)$
$\color{red}二次型$ 一般这样：
$x^TAx$

将我们上边的推理的状态分布带入该高维高斯分布的最小化负对数等式中：
$x^* = argmin\;((z_{k,j}-h(x_k,y_j))^T\cdot Q^{-1}_{k,j}\cdot (z_{k,j}-h(x_k,y_j))) \\\quad \\\Downarrow 因为第一项与x无关，所以只要最小化等式右侧二次型项即可 \\\Downarrow 其实这件事等价于最小化误差的平方(范数意义下) \\\quad \\ 这个括号里的 \;z_{k,j}恰好是观测，h(x_k,y_j)刚好是真实值，印证了上述的误差$

$\quad$ 那么对于任意运动和观测方程，定义它们分别的误差：
$\begin{cases} e_{v,k} = x_k - f(x_{k-1}, v_k)\quad 运动误差，一帧图像相机只有一个位姿 \\e_{y,j,k} = z_{k,j} - h(x_k,y_j) \quad 观测误差，一帧图像有多个点 \end{cases} \\ \quad \\ \Downarrow 将相应的e代入上式 x^* 中，运动方程对应形式也是一样 \\ \Downarrow 求误差的平方和（as\;we\;all\;know:A^tA=A的平方） \\ \quad \\J(x) = \sum_ke^T_{v,k}R_k^{-1}e_{v,k}+\sum_k\sum_je_{y,k,j}^TQ^{-1}_{k,j}e_{y,k,j} \\其中的R_{k}代表运动方程的误差所符合的高斯分布的误差项 \\同理Q_{k,j}代表运动方程的误差所符合的高斯分布的误差项$

这是SLAM中通用的最小二乘问题(Least Square Problem)。根据以上推导， $J (x)$ 的最优解就等价于状态的最大似然估计。
即一个非线性优化问题：微调状态估计值，使得误差下降到一个极小值的过程。
由于它的每个误差项仅于一两个状态有关，采取参数块的方式进行分块求各个误差的雅克比矩阵然后再带入整体的雅克比矩阵中。

对于变换的表述，李代数的使用可以使它没有约束。

至此，我们的问题转为研究一个 无约束的，非线性的最小二乘问题

下一节推理非线性最小二乘问题的求解，下一节再更吧，我要去写论文了，等我再更新的时候，就是我论文写完的时候。我先随便扔个链接哈哈。

终问鼎

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
【视觉SLAM入门】4.1. 从状态估计到非线性最小二乘推演------状态估计，最大后验，最大似然，最小二乘，高维高斯分布，非线性优化推导

考虑运动方程和观测方程在实际中其实是有噪声的情况，所以设噪声服从高维高斯分布，从头推导了机器人位姿估计，根据最大后验，贝叶斯公式，将它变成一个最大似然问题，进而通过考虑高维高斯分布将它转化成包含运动方程和观测方程的SLAM通用的非线性优化问题，具体成误差平方和，演变为求解一个最小二乘问题的过程
复制链接

扫一扫

专栏目录