SLAM--状态估计

机器人学渣

已于 2022-04-22 16:05:28 修改

阅读量1.2k

点赞数

分类专栏： SLAM 文章标签： slam 算法卡尔曼滤波算法

于 2021-05-29 20:14:39 首次发布

本文链接：https://blog.csdn.net/qq_42995327/article/details/117365012

版权

SLAM 专栏收录该内容

30 篇文章 15 订阅

订阅专栏

一、贝叶斯公式

若存在 $\bm X,\bm Y$ 随机变量，则 $p (x, y)$ 被称为 $(\bm X,\bm Y)$ 的联合概率密度函数；
边缘概率密度的性质：

性质1：
$\small p(x,y)=p(x|y)\cdot p(y)=p(y|x)\cdot p(x)$

性质2：
$\small \int p(x|y)\mathrm{d}x=1,\quad \int p(y|x)\mathrm{d}y=1,$

性质3：
$\small p(x)=\int p(x,y)\mathrm{d}y, \quad\;\; p(y)=\int p(x,y)\mathrm{d}x,$

贝叶斯公式：
$p(x|y)=\frac{p(y|x)p(x)}{p(y)}=\frac{p(y|x)p(x)}{\int p(y|x)p(x)\mathrm{d}x}$
对于分母 $p (y)$ ,我们可以利用边缘密度：
$\small p(y)=\int p(x,y)\mathrm{d}y=\int p(y|x)p(x)\mathrm{d}x$
在贝叶斯推断中，我们把p(x)称为先验，p(x|y)称为后验，p(y|x)称为似然概率；

二、高斯密度函数

设 $\bm X=\begin{bmatrix} \bm X_1 &\bm X_2 &... &\bm X_n\end{bmatrix}^T$ 是n维随机向量， $\bm x = \begin{pmatrix} x_1,x_2,...,x_n\end{pmatrix}^T$ ，则 $\bm X$ 的联合密度函数为：
$~\\ ~\\ p(x)=\frac {1} {(2\pi)^{\frac n 2}\bm ({\det} \bm B)^{\frac 1 2}}\exp(-\frac 1 2(\bm x-\bm \mu){\bm B^{-1}(\bm x-\bm \mu) }) \tag{1}$

记为 $\bm X\backsim \bm N(\bm \mu,\bm B)$ .

其中， $\bm \mu=\begin{bmatrix} \bm EX_1 ,\bm EX_2 ,... ,\bm EX_n\end{bmatrix}^T$ ，为各变量的数学期望或均值， $\bm B=[b_{ij}]_{n\times n}$ 矩阵为协方差矩阵:
$\bm E \bm X_k=\bm \mu_k, \bm b_{kl}=\bm {cov}(\bm X_k,\bm X_l)=\bm E[(\bm X_k-\bm E \bm X_k)(\bm X_l-\bm E\bm X_l)^T]\tag{2}$
高斯分布有一个重要的性质：

若 $\bm X\backsim \bm N(\bm \mu,\bm B)$ ， $\bm C$ 是 $\bm {m \times n}$ 的矩阵，则m维向量 $\bm{ Y = CX}$ 服从m维的正态分布 $\bm {N(C\mu,CBC^T)}$

三、联合高斯概率密度函数分解推导

存在多元正态分布 $(x, y)$ ，则联合高斯密度函数为：
$p(x,y)=\bm N(\begin{bmatrix} \bm \mu _x\\ \\\bm \mu _y \end{bmatrix},\begin{bmatrix} \bm {\sum} _{xx}& \bm {\sum} _{xy}\\ \\\bm {\sum} _{yx} & \bm {\sum} _{yy} \end{bmatrix})\tag{3}$
其中 $\bm {\sum} _{yx} =\bm {\sum} _{xy}^T$ 。

由贝叶斯法则：
$p(x,y)=p(x|y)\cdot p(y)\tag{4}$
分解指数p(x,y)的部分：
$\small \begin{aligned} &(\begin{bmatrix} \bm x\\ \\\bm y \end{bmatrix}-\begin{bmatrix} \bm \mu _x\\ \\\bm \mu _y \end{bmatrix})^T\begin{bmatrix} \bm {\sum} _{xx}& \bm {\sum} _{xy}\\ \\\bm {\sum} _{yx} & \bm {\sum} _{yy} \end{bmatrix}^{-1}(\begin{bmatrix} \bm x\\ \\\bm y \end{bmatrix}-\begin{bmatrix} \bm \mu _x\\ \\\bm \mu _y \end{bmatrix})\\ ~\\&=(\bm x-\bm \mu _x-\bm {\sum} _{xy}\bm {\sum} _{yy}^{-1}(\bm y-\bm \mu_y))^T \cdot ( \bm {\sum} _{xx}- \bm {\sum} _{xy} \bm {\sum} _{yy}^{-1} \bm {\sum} _{yx})^{-1}\cdot (\bm x-\bm \mu _x-\bm {\sum} _{xy}\bm {\sum} _{yy}^{-1}(\bm y-\bm \mu_y)) \\ &+(\bm y -\bm \mu _y)^T \bm {\sum} _{yy}^{-1} (\bm y -\bm \mu _y)\tag{5} \end{aligned}$
根据指数分解的结果以及 $p(x,y)=p(x|y)\cdot p(y)$ 可以得到：
$\small \begin{aligned} p(x|y)&=\bm N(\bm \mu _x+ \bm {\tiny \sum} _{xy}\bm {\tiny \sum} _{yy}^{-1}(\bm y-\bm \mu_y), \bm {\tiny \sum} _{xx}- \bm {\tiny \sum} _{xy} \bm {\tiny \sum} _{yy}^{-1} \bm {\tiny \sum} _{yx})\\ \\ p(y)&=\bm N(\bm \mu_y,\bm {\tiny \sum} _{yy}) \end{aligned}\tag{6}$
上面的式子是非常重要的，尤其是在推导卡尔曼滤波过程中。

四、线性高斯系统状态估计

4.1 离散状态的批量估计

设状态方程和观测方程分别为：

状态方程： $\bm x_k=\bm A_k\bm x_{k-1}+\bm u_k+\bm \omega_k,\bm \omega_k\backsim \bm N(0,\bm Q_k)$

观测方程： $\bm y_k=\bm C_k\bm x_k+\bm n_k,\bm n_k\backsim \bm N(0,\bm R_k)$

其中 $\bm \omega_k$ 和 $\bm n_k$ 为噪声， $\bm u_k$ 为输入， $\bm y_k$ 为观测。

我们利用 最大后验估计MAP 来进行推导，利用贝叶斯法则，所以MAP的优化目标为：
$\mathop {\arg\max }\limits_x p(x|y,u) =\mathop {\arg\max }\limits_x \frac {p(y|x,u) \cdot p(x|u)}{p(y|u)}=\mathop {\arg\max }\limits_x p(y|x,u)\cdot p(x|u)\tag{7}$

1.首先针对其中p(y|x,u)：
$\ln p(y|x,u)=-\frac 1 2 (y_k-C_kx_k)^TR_k^{-1}(y_k-C_kx_k)+m，m和x不相关 \\$
最后优化的目标函数为
$\Longrightarrow J_y(x)= -\frac 1 2 (y_k-C_kx_k)^TR_k^{-1}(y_k-C_kx_k)\tag{8}$

2.其次再针对p(x|u):
$\ln p(x|u)=-\frac 1 2 (x_k-A_kx_{k-1}-u_k)^TQ_k^{-1}(x_k-A_kx_{k-1}-u_k)+n，n和x不相关 \\$
最后优化的目标函数为
$\Longrightarrow J_u(x)= -\frac 1 2 (x_k-A_kx_{k-1}-u_k)^TQ_k^{-1}(x_k-A_kx_{k-1}-u_k)\tag{9}$

所以目标函数为:
$J(x)=J_u(x)+J_y(x)\\~\\=-\frac 1 2 (y_k-C_kx_k)^TR_k^{-1}(y_k-C_kx_k)+-\frac 1 2 (x_k-A_kx_{k-1}-u_k)^TQ_k^{-1}(x_k-A_kx_{k-1}-u_k)\tag{10}$

我们把 $\hat{x}$ 作为后验估计， $\check{x}$ 作为先验估计

即： $\hat{x}=\mathop {\arg\max }\limits_x J(x)$

我们令 $\bm z=[\bm {\check{x}_0,u_1,...,u_k|y_0,...,y_k}]^T$ ， $\bm {x=[x_0,...,x_k]^T}$ ，并且定义：
$\small \bm H=\begin{bmatrix} 1 \\ -A_0&1\\ &-A_1&1\\ &&...\\ &&& -A_{_{k-1} }&1\\ C_0\\&C_1\\&&...\\&&&C_{k-1}\\ &&&&C_k\end{bmatrix}$
$\small \bm W=\begin{bmatrix} \bm Q\\&\bm R \end{bmatrix}$
这时我们的目标函数可以写成：
$\small \bm J(x)=\frac 1 2 (\bm z-\bm Hx)^T\bm W^{-1}(\bm z-\bm Hx)\tag{11}$
由于W矩阵是对称矩阵，对目标函数求导可得：
$\small \frac {\partial J(x)}{\partial x}=(\bm H\hat{x}-\bm z)^T\bm W^{-1}\bm H\tag{12}$
令导数等于0：
$\small (\bm H\hat{x}-\bm z)^T\bm W^{-1}\bm H=0\\ ~\\ \Longrightarrow \bm H^T\bm W^{-1}(\bm H\hat{x}-\bm z)=0$
所以：
$\small (\bm H^T \bm W^{-1}\bm H)\hat{x}=\bm H^T\bm W^{-1}\cdot \bm z\tag{13}$

4.2 最大后验估计的协方差

根据贝叶斯法则，可以表示为：
$\small p(x|z)=\beta\exp(-\frac 1 2 (\bm Hx-\bm z)^T\bm W^{-1}(\bm Hx-\bm z)),\beta 为归一化因子\tag{14}$
联合式13可得：
$p(x|\hat{x})=\kappa\exp(-\frac 1 2 (x-\hat{x})^T(\bm H^T \bm W^{-1}\bm H)(x-\hat{x}))\tag{15}$
由 $x\backsim \bm N(\hat{x},\hat{P})$ 可以推断：

其中： $\small(\bm H^T \bm W^{-1}\bm H)^{-1}=\hat{P}$ ,即协方差；

4.3 利用稀疏性求解

至此，就可以求出x的最大后验估计，但我们不会直接求 $\small(\bm H^T \bm W^{-1}\bm H)^{-1}$ ，一般的方法是采用Cholesky分解或者利用矩阵的稀疏性来解。下面介绍Cholesky分解法：

注意到：
$\small \bm H^T \bm W^{-1}\bm H=\begin{bmatrix}*&*&\\ *&*&*\\&*&*&*\\ &&&.&.&.\\ &&&&.&.&.\\ &&&&&*&*&*\\ &&&&&&*&* \end{bmatrix}$
根据Cholesky分解法将其分解为：
$\small \bm H^T \bm W^{-1}\bm H=\bm L \bm L^T\tag{16}$
其中L为下三角矩阵：

$\small \bm L =\begin{bmatrix} *&\\ *&*\\&*&*&\\ &&.&.&.\\ &&&.&.&.\\ &&&&&*&*&\\ &&&&&&*&* \end{bmatrix}$
这样我们就可以先求解：
$\small \bm Ld=\bm H^T\bm W^{-1}\cdot \bm z\tag{17}$
之后求解：
$\small \bm L^T\hat{x}=d$
由于矩阵的特殊性，我们可以直接将上一步计算的结果直接代入到下一步直接求解，这里不再展开，具体参考：《机器人学中的状态估计》----p48-52

参考博文：

视觉SLAM中的数学——解方程AX=b与矩阵分解：奇异值分解（SVD分解）特征值分解 QR分解三角分解 LLT分解

五、离散卡尔曼滤波

5.1 线性高斯系统

存在状态方程和观测方程：
状态方程： $\bm x_k=\bm A_k\bm x_{k-1}+\bm u_k+\bm \omega_k,\bm \omega_k\backsim \bm N(0,\bm Q_k)$

观测方程： $\bm y_k=\bm C_k\bm x_k+\bm n_k,\bm n_k\backsim \bm N(0,\bm R_k)$

5.1.1 利用联合高斯概率密度推导

由贝叶斯公式：
$p(x_k,y_k|u_k)=p(x_k|y_k,u_k)\cdot p(y_k|u_k)\tag{18}$
由本文的第三节可以知道，当我们求出联合分布概率密度时，就能求出边缘概率密度；所以我们对 $p(x_k,y_k|u_k)$ 进行求解：
$p(x_k,y_k|u_k)=\bm N(\begin{bmatrix} \bm \mu _x\\ \\\bm \mu _y \end{bmatrix},\begin{bmatrix} \bm {\sum} _{xx}& \bm {\sum} _{xy}\\ \\\bm {\sum} _{yx} & \bm {\sum} _{yy} \end{bmatrix})=\bm N(\begin{bmatrix} \bm {\check{x_k}} \\ \\ \bm C_k\bm {\check{x_k}} \end{bmatrix},\begin{bmatrix} \bm {\sum} _{xx}& \bm {\sum} _{xy}\\ \\\bm {\sum} _{yx} & \bm {\sum} _{yy} \end{bmatrix})$
其中
$\small \bm {\sum} _{xy}=\bm E[(x_k-\bm Ex_k)(y_k-\bm Ey_k)^T]=E[(x_k-\bm {\check{x}_k})(\bm C_k\bm x_k-\bm C_k\bm {\check{x}_k})^T]\\ ~\\ \Longrightarrow \bm {\sum} _{xy}= \bm {\sum} _{xx}\cdot \bm C_k^T=\bm {\check{P}_k}\cdot \bm C_k^T \tag{19}$
由于对称矩阵，所以 $\bm {\sum} _{yx}= \bm {\sum} _{xy}^T= \bm C_k\cdot \bm {\check{P}_k}$

所以：
$p(x_k,y_k|u_k)=\bm N(\begin{bmatrix} \bm {\check{x_k}} \\ \\ \bm C_k\bm {\check{x_k}} \end{bmatrix},\begin{bmatrix} \bm {\check{P}_k}& \bm {\check{P}_k}\cdot \bm C_k^T\\ \\\bm C_k\cdot \bm {\check{P}_k} & \bm C_k\bm{\check{P}_k}\bm C_k^T+\bm R_k \end{bmatrix})\tag{20}$

所以很快求出：
$\small p(x_k|y_k,u_k)=\bm N(\bm \mu _x+ \bm {\tiny \sum} _{xy}\bm {\tiny \sum} _{yy}^{-1}(\bm y-\bm \mu_y), \bm {\tiny \sum} _{xx}- \bm {\tiny \sum} _{xy} \bm {\tiny \sum} _{yy}^{-1} \bm {\tiny \sum} _{yx})\\ ~\\ \Longrightarrow = \bm N(\check{x}_k+\bm {\check{P}_k}\cdot \bm C_k^T(\bm C_k\bm{\check{P}_k}\bm C_k^T+\bm R_k)^{-1}(y_k-\bm C_k\check{x}_k),(1-\bm {\check{P}_k}\cdot \bm C_k^T(C_k\bm{\check{P}_k}\bm C_k^T+\bm R_k)^{-1}\bm C_k)\bm {\check{P}_k})\tag{21}$

------------更新------------
为了简化,我们令:
$K_k=\bm {\check{P}_k}\cdot \bm C_k^T(\bm C_k\bm{\check{P}_k}\bm C_k^T+\bm R_k)^{-1}\\ ~\\ \bm {\hat{P}_k}=(1-K_k\bm C_k)\bm {\check{P_k}}\\ ~\\ \bm {\hat{x}_k}= \bm {\check{x}_k}+K_k(\bm y_k-\bm C_k\bm {\check{x}_k})\tag{22}$
$K_k$ 我们也称为卡尔曼增益

------------预测------------
其中：
$\left \{ \begin{aligned} &\bm {\check{x}_k=A_k \hat{x}_{k-1}+u_k}\\ ~\\ &\bm {\check{P_k}}=\bm{A_k\hat{P}_{k-1}A_k^T+Q_k}\\ \end{aligned} \right.\tag{23}$
上面就是卡尔曼滤波的更新过程

5.1.2 最大后验估计推导

由贝叶斯法则得：
$\small\begin{aligned} \mathop {\arg\max }\limits_{x_k} \ p(x_k|y_k,u_k)&=\mathop {\arg\max }\limits_{x_k}\frac{p(y_k|x_k,u_k)\cdot p(x_k|u_k)}{p(y_k|u_k)}\\ ~\\ &=\mathop {\arg\max }\limits_{x_k} p(y_k|x_k,u_k)\cdot p(x_k|u_k)\tag{24} \end{aligned}$
$p(y_k|u_k)$ 与要估计的 $x_k$ 无关，所以可以直接忽略。其中： $p(x_k|y_k,u_k)$ 为后验概率， $p(y_k|x_k,u_k)$ 为似然， $p(x_k|u_k)$ 为先验概率。

但直接求后验是非常困难的，所以我们需要来求后者的概率分布：

1.对于先验分布
$\small p(x_k|u_k)=\bm N(\bm {\check{x}_k},\bm {\check{P}_k})\\ ~\\ 其中:\qquad \bm {\check{x}_k=A_k\hat{x}_{k-1}+u_k},\quad \bm{\check{P}_k=A_k\hat{P}_{k-1}A_k^T+Q_k}\tag{25}$
2.似然部分
$p(y_k|x_k,u_k)=\bm N(\bm C_k \bm x_k,\bm R_k)\tag{26}$

3.后验估计部分
设有：
$p(x_k|y_k,u_k)=\bm N(\bm {\hat{x}_k},\bm {\hat{P}_k})\\ ~\\ \therefore \bm N(\bm {\hat{x}_k},\bm {\hat{P}_k})=\mu \bm N(\bm C_k \bm x_k,\bm R_k)\cdot \bm N(\bm {\check{x}_k},\bm {\check{P}_k}) \tag{27}$
对于高斯分布来说，我们一般不会在意前面的因子部分，更注重的是高斯密度函数指数展开部分，因为高斯分布的指数部分包含了所有均值和协方差信息。

$\small \bm{(x_k-\hat{x}_k)^T\hat{P}_k^{-1}(x_k-\hat{x}_k)=(y_k-C_kx_k)R_k^{-1}(y_k-C_kx_k)+(x_k-\check{x}_k)^T\check{P}_k^{-1}(x_k-\check{x}_k)} \tag{28}$
我们考虑 $\bm x_k$ 二次型的系数：
$\bm{\hat{P}_k^{-1}=C_k^{T}R_k^{-1}C_k+\check{P}_k^{-1}} \tag{29}$
我们定义一个中间量： $K_k=\bm {\hat{P}_k}\bm C_k^{T}\bm R_k^{-1}$
$\therefore\quad \bm {\hat{P}_k}=(1-K_k\bm C_k)\bm {\check{P_k}} \tag{30}$
再分析一次系数：
$-2\bm {\hat{x}_k^T\hat{P}_k^{-1}x_k}=-2 \bm {y_k^TR_k^{-1}C_kx_k}-2\bm {\check{x}_k^T\check{P}_k^{-1}x_k} \tag{31}$
根据系数并转置，最后表示 $\bm {\hat{x_k}}$ 得：
$\bm {\check{x}_k}+K_k(\bm y_k-\bm C_k\bm {\check{x}_k}) \tag{32}$

5.1.3 卡尔曼滤波迭代算法

根据推导，我们的卡尔曼滤波迭代过程为：
------------第一步：预测------------
$\small \left \{ \begin{aligned} &\bm {\check{x}_k=A_k \hat{x}_{k-1}+u_k}\\ ~\\ &\bm {\check{P_k}}=\bm{A_k\hat{P}_{k-1}A_k^T+Q_k}\\ \end{aligned} \right.\tag{33}$
------------第二步：更新------------
$\small \left \{ \begin{aligned} K_k&=\bm {\check{P}_k}\cdot \bm C_k^T(\bm C_k\bm{\check{P}_k}\bm C_k^T+\bm R_k)^{-1}\\ ~\\ \bm {\hat{P}_k}&=(1-K_k\bm C_k)\bm {\check{P_k}}\\ ~\\ \bm {\hat{x}_k}&= \bm {\check{x}_k}+K_k(\bm y_k-\bm C_k\bm {\check{x}_k}) \end{aligned} \right.\tag{34}$
卡尔曼滤波是最大后验概率估计，主要根据是高斯分布的线性变换依然是高斯分布，另外高斯密度函数也可以进行相应的线性变换。

5.2 非线性高斯系统

存在非线性的状态方程和观测方程：

状态方程： $\bm x_k=f(\bm x_{k-1},\bm u_k)+\bm \omega_k,\bm \omega_k\backsim \bm N(0,\bm Q_k)$

观测方程： $\bm y_k=h(\bm x_k)+\bm n_k,\bm n_k\backsim \bm N(0,\bm R_k)$

由泰勒展开式：
在这里插入图片描述

线性化：
$f(x_{k-1 },u_k)\approx f(\hat{x}_{k-1},u_k)+\frac {\partial f(\bm{\hat{x}_{k-1},u_k}) } {\partial \bm x_{k-1}}\cdot(x_{k-1}-\hat{x}_{k-1})=\check{x}_k+\frac {\partial f } {\partial \bm x_{k-1}}\Bigg|_{\bm{\hat{x}_{k-1},u_k}}\cdot(x_{k-1}-\hat{x}_{k-1})$
$h(x_k)\approx\check{y}_k+\frac {\partial h } {\partial \bm x_k} \Bigg|_{\bm{\check{x}_{k}}}(x_{k}-\check{x}_{k})$

我们不再详细推导过程，我们令：
$\bm F=\frac {\partial f } {\partial \bm x_{k-1}}\Bigg|_{\bm{\hat{x}_{k-1},u_k}} \\ ~\\\bm H=\frac {\partial h } {\partial \bm x_k} \Bigg|_{\bm{\check{x}_{k}}}$

------------第一步：预测------------
$\small \left \{ \begin{aligned} &\bm {\check{x}_k= f(\bm {\hat{x}_{k-1}},\bm u_k) }\\ ~\\ &\bm {\check{P_k}}=\bm{F\hat{P}_{k-1}F^T+Q_k}\\ \end{aligned} \right.\tag{35}$
------------第二步：更新------------
$\small \left \{ \begin{aligned} K_k&=\bm {\check{P}_k}\cdot \bm H^T(\bm H\bm{\check{P}_k}\bm H^T+\bm R_k)^{-1}\\ ~\\ \bm {\hat{P}_k}&=(1-K_k\bm H)\bm {\check{P_k}}\\ ~\\ \bm {\hat{x}_k}&= \bm {\check{x}_k}+K_k(\bm y_k-\bm h(\bm {\check{x}_k})) \end{aligned} \right.\tag{36}$
至此，卡尔曼滤波的算法就推导完成。

机器人学渣

关注

0
点赞
踩
21

收藏

觉得还不错? 一键收藏
0
评论
SLAM--状态估计

目录一、高斯密度函数二、联合高斯概率密度函数分解推导三、线性高斯系统状态估计3.1 离散状态的批量估计3.2 最大后验估计的协方差一、高斯密度函数设X=[X1X2...Xn]T\bm X=\begin{bmatrix} \bm X_1 &\bm X_2 &... &\bm X_n\end{bmatrix}^TX=[X1X2...Xn]T是n维随机向量，x=(x1,x2,...,xn)T\bm x = \begin{pmatrix} x_1,x_2,...,x_n\e
复制链接

扫一扫