概率机器人总结——(扩展)卡尔曼滤波先实践再推导

Leo-Peng

已于 2024-02-16 14:43:17 修改

阅读量1.8k

点赞数 5

分类专栏：视觉SLAM 视觉SLAM从入门到放弃文章标签： SLAM 概率机器人卡尔曼滤波

于 2019-05-22 21:01:31 首次发布

本文链接：https://blog.csdn.net/weixin_44580210/article/details/90417331

版权

视觉SLAM 同时被 2 个专栏收录

42 篇文章 107 订阅

订阅专栏

视觉SLAM从入门到放弃

30 篇文章 178 订阅

订阅专栏

概率机器人总结——卡尔曼滤波先实践再推导

概率机器人总结——(扩展)卡尔曼滤波先实践再推导

概率机器人总结——(扩展)卡尔曼滤波先实践再推导

为什么要把扩展两个字加个括号呢，因为本文的实践过程是以扩展卡尔曼为例，但是推导过程主要是参考博客卡尔曼滤波 – 从推导到应用(一)，相较于《概率机器人》上的推导过程更容易理解，而《概率机器人》上对于扩展卡尔曼滤波的推到也是基于卡尔曼滤波进行了一个拓展，因此本文以卡尔曼滤波推导为学习样例，然后加入个人的一些理解分析

（1）卡尔曼、扩展卡尔曼、粒子滤波到底什么关系？

徐亦达老师的卡尔曼滤波的推导视频里强调了这几个滤波的关系，如下：

模型类型	$p\left(x_{k} \mid x_{k-1}\right)$	$p(y_t \mid x_t)$	$p(x_1)$	说明
离散状态动态模型	$Ax_t+Bu_t$	$Hx_t$	$\pi$	隐马尔科夫模型，无滤波
线性高斯动态模型	$N(Ax_t+Bu_t+\delta, Q)$	$N(Hx_t+c, R)$	$N(\mu,\sigma)$	卡尔曼滤波
非线性非高斯动态模型	$f(x_{t-1})$	$g(x_{t-1})$	$f(x_0)$	粒子滤波
首先什么是动态模型呢？

这个就是状态模型，在离散状态下就是大名鼎鼎的隐马尔科夫模型，在机器学习范畴内非常有效的一种模型，而当我们的状态转移方程和观测方程都变成线性高斯模型之后，这时候处理最有效的方式之一就是卡尔曼滤波，而扩展卡尔曼呢？当动态模型都为非线性高斯模型是就是用扩展卡尔曼滤波（其基本思路就是将非线性模型线性化），而最后最复杂的是非线性非高斯模型，怎么办呢？粒子滤波咯，粒子滤波我写了一个同款博客，欢迎参考概率机器人总结——粒子滤波先实践再推导，这就是他们之间的关系。

（2）实践——扩展卡尔曼滤波

首先给出线性高斯动态模型的状态转移方程和观测方程，如下： $x_{t}=A_{t} x_{t-1}+B_{t} u_{t}+\varepsilon_{t}$ $z_{t}=C_{t} x_{t}+\delta_{t}$
其中 $\varepsilon_{t}$ 和 $\delta_{t}$ 分别为满足零均值高斯分布的噪声。
然后，我们从卡尔曼滤波的公式开始，如下：
$\begin{aligned} \overline{\mu}_{t} &=A_{t} \mu_{t-1}+B_{t} u_{t} \\ \overline{\Sigma}_{t} &=A_{t} \Sigma_{t-1} A_{t}^{T}+R_{t} \\ K_{t} &=\overline{\Sigma}_{t} C_{t}^{T}\left(C_{t} \overline{\Sigma}_{t} C_{t}^{T}+Q_{t}\right)^{-1} \\ \mu_{t} &=\overline{\mu}_{t}+K_{t}\left(z_{t}-C_{t} \overline{\mu}_{t}\right) \\ \Sigma_{t} &=\left(I-K_{t} C_{t}\right) \overline{\Sigma}_{t} \end{aligned}$
如果没有接触过卡尔曼滤波，第一次看到这些公式会觉得怎么这么复杂，学明白之后发现其实还是蛮简单的，这里先简单说下对这个公式的理解
第一个公式和均值（期望）有关，指的是通过上一个状态的均值 $\mu_{t-1}$ 和控制量以及状态转移方程预测出下一个状态的均值 $\overline{\mu}_{t}$
第二个公式和方差有关，指的是根据上一个状态的方差 $\Sigma_{t-1}$ 和噪声的方差 $R_{t}$ 预测出下一个状态的方差 $\overline{\Sigma}_{t}$

注意高斯分布的状态的变量其实就均值和方差两个东西，通过第一步和第二步我们就完成了【预测过程】

第三个公式和卡尔曼增益有关，指的是通过观测方程及其噪声的方差计算卡尔曼增益
第四个公式和均值有关，指的是通过卡尔曼增益对预测出来的均值进行更新
第五个公式和方差有关，和第四步一样，指的是通过卡尔曼增益对预测出来方差进行更新

我们先计算了卡尔曼增益然后分别跟新了均值和方差两个东西，通过后面三步我们就完成了【更新过程】

好了，卡尔曼滤波搞清楚了，我们再来看下扩展卡尔曼滤波，首先给出非线性高斯动态模型的方程，如下： $x_{t}=g\left(u_{t}, x_{t-1}\right)+\varepsilon_{t}$ $z_{t}=h\left(x_{t}\right)+\delta_{t}$
同理，其中 $\varepsilon_{t}$ 和 $\delta_{t}$ 分别为满足零均值高斯分布的噪声。
$\begin{aligned} \overline{\mu}_{t} &=g\left(u_{t}, \mu_{t-1}\right) \\ \overline{\Sigma}_{t} &=G_{t} \Sigma_{t-1} G_{t}^{T}+R_{t} \\ K_{t} &=\overline{\Sigma}_{t} H_{t}^{T}\left(H_{t} \overline{\Sigma}_{t} H_{t}^{T}+Q_{t}\right)^{-1} \\ \mu_{t} &=\overline{\mu}_{t}+K_{t}\left(z_{t}-h\left(\overline{\mu}_{t}\right)\right) \\ \Sigma_{t} &=\left(I-K_{t} H_{t}\right) \overline{\Sigma}_{t} \end{aligned}$
和卡尔曼滤波一对比，发现简直一模一样，主要不同的是将状态转移方程中系数矩阵 $A_t,C_t$ 换成了非线性方程的雅克比矩阵 $G_t,H_t$ ，为什么是雅克比矩阵，这当然是和推导有关，我们可以先直观感受下，在《概率机器人》的推导过程中，在对状态转移的分布进行积分获状态的置信度时需要提取出来一个关键公式： $\begin{aligned} L_{t}=& \frac{1}{2}\left(x_{t}-A_{t} x_{t-1}-B_{t} u_{t}\right)^{\mathrm{T}} R_{t}^{-1}\left(x_{t}-A_{t} x_{t-1}-B_{t} u_{t}\right)+\\ & \frac{1}{2}\left(x_{t-1}-\mu_{t-1}\right)^{\mathrm{T}} \Sigma_{t-1}^{-1}\left(x_{t-1}-\mu_{t-1}\right) \end{aligned}$
而扩展卡尔曼滤波的这个对应的公式是 $\begin{aligned} L_{t}=& \frac{1}{2}\left[x_{t}-g\left(\boldsymbol{u}_{t}, \boldsymbol{\mu}_{t-1}\right)-G_{t}\left(\boldsymbol{x}_{t-1}-\boldsymbol{\mu}_{t-1}\right)\right]^{\mathrm{T}} \boldsymbol{R}_{t}^{-1}\left[\boldsymbol{x}_{t}-g\left(\boldsymbol{u}_{t}, \boldsymbol{\mu}_{t-1}\right)-G_{t}\left(\boldsymbol{x}_{t-1}-\boldsymbol{\mu}_{t-1}\right)\right] \\ &+\frac{1}{2}\left(\boldsymbol{x}_{t-1}-\boldsymbol{\mu}_{t-1}\right)^{\mathrm{T}} \boldsymbol{\Sigma}_{t-1}^{-1}\left(\boldsymbol{x}_{\boldsymbol{t}-1}-\boldsymbol{\mu}_{t-1}\right) \end{aligned}$
我们发现状态 $x_t-1$ 前的系数矩阵就是由 $A_t$ 变为了 $G_t$ ，但是这样理解可能还不够直观。

下面我们可以看下PythonRobotics中提供的拓展卡尔曼滤波的python代码是怎么写的

def ekf_estimation(xEst, PEst, z, u):

    #  Predict
    xPred = motion_model(xEst, u)
    jF = jacobF(xPred, u)
    PPred = jF.dot(PEst).dot(jF.T) + R

    #  Update
    jH = jacobH(xPred)
    zPred = observation_model(xPred)
    y = z.T - zPred
    S = jH.dot(PPred).dot(jH.T) + Q
    K = PPred.dot(jH.T).dot(np.linalg.inv(S))
    xEst = xPred + K.dot(y)
    PEst = (np.eye(len(xEst)) - K.dot(jH)).dot(PPred)

    return xEst, PEst

我这里都不要太多解释，对应着公式看就能都对应上，这里比较有意思的一个点是代码为了追求简单采样了线性高斯动态模型来代替的非线性高斯动态模型，就是用扩展卡尔曼滤波来解了一个线性高斯动态模型，我们可以看下这个雅克比矩阵是怎么处理的，以状态转移方程为例：

def jacobF(x, u):
    yaw = x[2, 0]
    v = u[0, 0]
    jF = np.array([
        [1.0, 0.0, -DT * v * math.sin(yaw), DT * math.cos(yaw)],
        [0.0, 1.0, DT * v * math.cos(yaw), DT * math.sin(yaw)],
        [0.0, 0.0, 1.0, 0.0],
        [0.0, 0.0, 0.0, 1.0]])

    return jF

代码中这个矩阵是怎么来的呢？
首先状态转移方程的模型是这样的： $\mathbf{x}_{t+1}=F \mathbf{x}_{t}+B \mathbf{u}_{t}$
其中 $F=\left[ \begin{array}{llll}{1} & {0} & {0} & {0} \\ {0} & {1} & {0} & {0} \\ {0} & {0} & {1} & {0} \\ {0} & {0} & {0} & {0}\end{array}\right]$ 以及 $B=\left[ \begin{array}{cc}{\cos (\phi) d t} & {0} \\ {\sin (\phi) d t} & {0} \\ {0} & {d t} \\ {1} & {0}\end{array}\right]$

然后雅克比矩阵的计算公式是 $J_{F}=\left[ \begin{array}{cccc}{\frac{d x}{d x}} & {\frac{d x}{d y}} & {\frac{d x}{d \phi}} & {\frac{d x}{d v}} \\ {\frac{d y}{d x}} & {\frac{d y}{d y}} & {\frac{d y}{d \phi}} & {\frac{d y}{d v}} \\ {\frac{d \phi}{d x}} & {\frac{d \phi}{d y}} & {\frac{d \phi}{d \phi}} & {\frac{d \phi}{d v}} \\ {\frac{d v}{d x}} & {\frac{d v}{d y}} & {\frac{d v}{d \phi}} & {\frac{d v}{d v}}\end{array}\right]$ 把所有变量都带进去就可以得到 $J_{F}=\left[ \begin{array}{cccc}{1} & {0} & {-v \sin (\phi) d t} & {\cos (\phi) d t} \\ {0} & {1} & {v \cos (\phi) d t} & {\sin (\phi) d t} \\ {0} & {0} & {1} & {0} \\ {0} & {0} & {0} & {1}\end{array}\right]$ 通过这个例子可以加深我们对扩展卡尔曼滤波的实际操作的理解。
然后代码运行的结果如下（建议读下源码，对理解很有帮助）：
在这里插入图片描述

（3）推导——卡尔曼滤波

卡尔曼滤波的推导各有千秋，《概率机器人》上是直接对高斯分布的形式进行积分，然后通过求积分结果（正态分布）的极小值和方差获得预测或者下一状态的均值和方差，而徐亦达老师的视频课程是通过高斯形式的联合分布来给出结论的，但是给我印象最深的还是白巧克力亦唯心博主（贺博，大佬大佬…）给出来的推导过程，下面我基于鉴于博客的推导过程给出自己的理解。

首先给出运动方程和观测方程，这应该没什么问题：
$x_{k}=A x_{k-1}+B u_{k-1}+w_{k-1}（1）$ $z_{k}=H x_{k}+v_{k}（2）$ 其中， $\sim N(0, Q)$ ， $\sim N(0, R)$
我们首先明确，这两个方程我们都是已知的，我们能够通过运动方程得到理论预测（先验），然后我们又有观测数据，通过观测数据我们可以对理论预测进行修正，从而得到后验。

这里我们给出这样一个修正公式 $\hat{x}_{k}=\hat{x}_{k}^{\prime}+K_{k}\left(z_{k}-\hat{z}_{k}\right)=\hat{x}_{k}^{\prime}+K_{k}\left(z_{k}-H \hat{x}_{k}^{\prime}\right)（3）$ 其中， $\hat{x}_{k}^{\prime}$ 是我们理论预测值（先验）， $\hat{x}_{k}$ 是我们修正后的估计值（后验）， $\hat{z}_{k}$ 是测量值的预测值（就是将我们的状态预测值， $\hat{x}_{k}^{\prime}$ 带入观测方程得到的结果）， $z_{k}$ 就是我们实际的测量值， $\left(z_{k}-H \hat{x}_{k}^{\prime}\right)$ 就是残差。

这里通过协方差矩阵往下推，首先给出估计值和真实值之前的协方差矩阵： $P_{k}=E\left[e_{k} e_{k}^{T}\right]=E\left[\left(x_{k}-\hat{x}_{k}\right)\left(x_{k}-\hat{x}_{k}\right)^{T}\right]（4）$ 将上文的（3）式和（2）式代入得 $P_{k}=E\left[\left[\left(I-K_{k} H\right)\left(x_{k}-\hat{x}_{k}^{\prime}\right)-K_{k} v_{k}\right]\right.\left[\left(I-K_{k} H\right)\left(x_{k}-\hat{x}_{k}^{\prime}\right)-K_{k} v_{k}\right]^{T} ]（5）$ 然后我们给出理论预测值和真实值之间的协方差矩阵 $P_{k}^{\prime}=E\left[e_{k}^{\prime} e_{k}^{\prime T}\right]=E\left[\left(x_{k}-\hat{x}_{k}^{\prime}\right)\left(x_{k}-\hat{x}_{k}^{\prime}\right)^{T}\right]$ 展开（5）式得 $P_{k}=\left(I-K_{k} H\right) E\left[\left(x_{k}-\hat{x}_{k}^{\prime}\right)\left(x_{k}-\hat{x}_{k}^{\prime}\right)^{T}\right]\left(I-K_{k} H\right)+\quad K_{k} E\left[v_{k} v_{k}^{T}\right] K_{k}^{T}$ 得 $P_{k}=\left(I-K_{k} H\right) P_{k}^{\prime}\left(I-K_{k} H\right)^{T}+K_{k} R K_{k}^{T}$ 得 $P_{k}=P_{k}^{\prime}-K_{k} H P_{k}^{\prime}-P_{k}^{\prime} H^{T} K_{k}^{T}+K_{k}\left(H P_{k}^{\prime} H^{T}+R\right) K_{k}^{T}$ 协方差的矩阵的对角线元素就是方差，我们对上式所有对角线元素求和，求和结果满足下式 $T\left[P_{k}\right]=T\left[P_{k}^{\prime}\right]-2 T\left[K_{k} H P_{k}^{\prime}\right]+T\left[K_{k}\left(H P_{k}^{\prime} H^{T}+R\right) K_{k}^{T}\right]$ 我们求一个K使得最小均方误差最小，于是对上式求导有 $\frac{d T\left[P_{k}\right]}{d K_{k}}=-2\left(H P_{k}^{\prime}\right)^{T}+2 K_{k}\left(H P_{k}^{\prime} H^{T}+R\right)$ $K_{k}=P_{k}^{\prime} H^{T}\left(H P_{k}^{\prime} H^{T}+R\right)^{-1}$ 当当当！这就是卡尔曼增益啦，卡尔曼增益里面包含了一个我们前文提到过的 $P_{k}^{\prime}$ （预测值与真实值之间的协方差矩阵），它是怎么求的呢？通过我们预测过程求解出来的： $\begin{aligned} P_{k+1}^{\prime} &=E\left[e_{k+1}^{T} e_{k+1}^{T \prime}\right] \\ &=E\left[\left(x_{k+1}-\hat{x}_{k+1}^{\prime}\right)\left(x_{k+1}-\hat{x}_{k+1}^{\prime}\right)^{r}\right] \\ &=E\left[\left(A\left(x_{k}-\hat{x}_{k}\right)+\omega_{k}\right)\left(A\left(x_{k}-\hat{x}_{k}\right)+\omega_{k t}\right)^{r}\right] \\ &=E\left[\left(A e_{k}\right)\left(A e_{k}\right)^{r}\right]+E\left[\omega_{k} \omega_{k}^{T}\right] \\ &=A P_{k} A^{T}+Q \end{aligned}$ 倒数第三步到倒数第二步的原因是状态变量与噪声独立，到这里卡尔曼滤波中的所有公式都可解释了，是不是很爽快！

（4）顺便问一句，如何通过卡尔曼滤波进行多传感器融合？

扩展卡尔曼滤波EKF与多传感器融合这个博客简单地讲清楚了这个问题，如下两张PPT所示:
在这里插入图片描述
如果卡尔曼滤波搞得差不多清楚了的话这两张图就很好理解了，Predicition预测的方式是相同的，Update更新是他们的测量方程不同，例如这篇博客中举的例子，对于激光而言，观测矩阵如下： $x+R=\left[ \begin{array}{cccc}{1} & {0} & {0} & {0} \\ {0} & {1} & {0} & {0}\end{array}\right] \left[ \begin{array}{c}{p_{x}} \\ {p_{y}} \\ {v_{x}} \\ {v_{y}}\end{array}\right]+\left[ \begin{array}{cc}{0.0225} & {0} \\ {0} & {0.0225}\end{array}\right]$ 对于雷达而言 $z=f(x)+R=\left[ \begin{array}{c}{\rho} \\ {\phi} \\ {\dot{\rho}}\end{array}\right]=\left[ \begin{array}{c}{\sqrt{p_{x}^{2}+p_{y}^{2}}} \\ {\arctan \frac{p_{y}}{p_{x}}} \\ {\frac{p_{x} v_{x}+p_{y} v_{y}}{\sqrt{p_{x}^{2}+p_{y}^{2}}}}\end{array}\right]+\left[ \begin{array}{ccc}{0.09} & {0} & {0} \\ {0} & {0.0009} & {0} \\ {0} & {0} & {0.09}\end{array}\right]$
因此在扩展卡尔曼滤波的更新过程中就会不一样，在工程实践方面肯定还存在这许多实践细节要注意，这里就不在细究，之后遇到实际项目时再进一步考虑。

就到这里啦，有问题欢迎交流～

此外，对SLAM算法感兴趣的同学可以看考我的博客SLAM算法总结——经典SLAM算法框架总结

Leo-Peng

关注

5
点赞
踩
32

收藏

觉得还不错? 一键收藏
1
评论
概率机器人总结——(扩展)卡尔曼滤波先实践再推导

概率机器人总结——卡尔曼滤波先实践再推导概率机器人总结——(扩展)卡尔曼滤波先实践再推导卡尔曼、扩展卡尔曼、粒子滤波到底什么关系？扩展卡尔曼滤波的实践卡尔曼滤波的推导概率机器人总结——(扩展)卡尔曼滤波先实践再推导为什么要把扩展两个字加个括号呢，因为本文的实践过程是以扩展卡尔曼为例，但是推导过程主要是参考博客卡尔曼滤波 – 从推导到应用(一)，相较于《概率机器人》上的推导过程更容易理解，而《概...
复制链接

扫一扫