卡尔曼滤波学习记录

最新推荐文章于 2024-07-26 13:24:37 发布

cmf8797143

最新推荐文章于 2024-07-26 13:24:37 发布

阅读量279

点赞数

分类专栏：无人驾驶文章标签：无人驾驶卡尔曼滤波人工智能

本文链接：https://blog.csdn.net/cmf8797143/article/details/88063576

版权

无人驾驶专栏收录该内容

1 篇文章 0 订阅

订阅专栏

前言

博主是做无人驾驶车辆建图与定位的，所以针对于车辆方面来浅显的学习。
这一部分是关于卡尔曼滤波器的理论部分，言简意赅，只写关键的东西。
卡尔曼滤波的核心就是预测与更新。预测一个理论值，再根据测量值去修正这个理论值。
预测的值称为预测值，修正后的值称为估计值。

推理过程

方程

卡尔曼滤波主要用于测量数据与推测数据的融合，浅显的解释就是，我用一个系统算了一个值，比如说车速，我还有一个传感器能够测一个车速，这两个速度值都存在着不同程度的误差，那么我就把他俩融合起来，求一个比较准确的速度。

处理方程

处理方程就是抽象实际情况中的系统状态，得到处理模型方程。
一般我们遇到的处理方程是这样：
$\LARGE x_k=Ax_{k-1}+Bu_k+\epsilon$
其中传递的意思就是，该系统 $k$ 时刻的状态 $x_k$ 由 $k - 1$ 时刻的状态 $x_{k-1}$ 与转换矩阵 $A$ 作用 $+$ 输入的数据 $u_k$ 与转换矩阵 $B$ 作用+噪声 $\epsilon$ 。
注意：该方程也常称为预测方程，即我们通过这个方程算出来的 $x_t$ 是一个理论值。真实情况还需要用理论结合实际测量值计算出来。

用一个匀加速直线运动举例，根据物理知识，易得方程组
$\LARGE S_k=S_{k-1}+V_{k-1}\Delta t+\frac{1}{2}a(\Delta t)^2$
$\LARGE V_k=V_{k-1}+a\Delta t$
$S$ 是位移， $V$ 是速度， $a$ 是加速度， $\Delta t$ 是间隔时间，即 $k$ 时刻与 $k - 1$ 时刻的时间差值
把这个方程组和状态方程进行类比，我们可以得到
$\LARGE \begin{bmatrix} S_{k}\\V_{k} \end{bmatrix}\quad =\begin{bmatrix}1&\Delta t\\0&1\end{bmatrix}*\begin{bmatrix}S_{k-1}\\V_{k-1}\end{bmatrix} +\begin{bmatrix}\frac{1}{2}a(\Delta t)^2\\\Delta t\end{bmatrix}*a$
状态方程里面的 $x_k=\begin{bmatrix} S_{k}\\V_{k} \end{bmatrix}$ $A=\begin{bmatrix}1&\Delta t \\0&1\end{bmatrix}$ $B=\begin{bmatrix}\frac{1}{2}(\Delta t)^2\\\Delta t\end{bmatrix}$ $u_k=a$
此时我们并没有考虑噪声的存在情况，及处理方程里面的 $\epsilon_t$
既然我们现在有了处理方程，那么直接进行计算不就行了吗？为啥还要参考测量值呢？那是因为真实的世界环境中，一个系统的状态非常复杂，往往无法精确建模，如果只按照处理方程来进行计算，那么每次计算就会对误差进行 $A$ 倍的放大，会越来越不准，所以需要引入测量量和系统噪声， $\epsilon_t$ 就是状态方程的噪声

测量方程

测量方程指的是系统 $t$ 时刻状态 $x_t$ 映射出来的一些特征 $z_t$

$\LARGE z_k=Hx_k+\nu$
测量方程中的 $x_k$ 同状态方程中的 $x_k$ ， $\nu$ 是测量噪声，没有百分百能够测得准的传感器， $z_k$ 是测量值， $H$ 是映射矩阵，把状态值变化为测量值
回到我们的例子里面，假设我们在起点处放置了一个传感器，该传感器可以测得位移大小，那么我们的测量方程就是
$z_k=\begin{bmatrix}1&0\end{bmatrix}*\begin{bmatrix}S_k\\V_k\end{bmatrix}$
注：此处没有写出噪声那么 $H=\begin{bmatrix}1&0\end{bmatrix}$
对于测量方程，其实测量值 $z$ 是我们通过传感器去测量得到的，那么这个方程由什么作用呢，这个方程的作用就是带入我们在状态方程中求的 $x_k$ ，称为预测值，记为 $\hat{x_k}$ ，然后计算 $\hat{x_k}$ 的测量值 $z_k$ ，记为 $\hat{z_k}$ ，再和实际情况下通过测量得到的 $z_t$ 进行比较，继而进行融合

方程小汇总

此处对上述所提到的方程进行一个小的汇总

处理方程

$\LARGE x_k=Ax_{k-1}+Bu_k+\epsilon$

测量方程

$\LARGE z_k=Hx_k+\nu$

例

按照匀加速运动的例子

处理方程

$\LARGE \begin{bmatrix} S_{k}\\V_{k} \end{bmatrix}\quad =\begin{bmatrix}1&\Delta t\\0&1\end{bmatrix}*\begin{bmatrix}S_{k-1}\\V_{k-1}\end{bmatrix} +\begin{bmatrix}\frac{1}{2}a(\Delta t)^2\\\Delta t\end{bmatrix}*a+\epsilon$
其中 $x_k=\begin{bmatrix} S_{k}\\V_{k} \end{bmatrix}$ $A=\begin{bmatrix}1&\Delta t \\0&1\end{bmatrix}$ $B=\begin{bmatrix}\frac{1}{2}(\Delta t)^2\\\Delta t\end{bmatrix}$ $u_k=a$ $\epsilon$ 是处理方程的噪声

测量方程

$\LARGE z_k=\begin{bmatrix}1&0\end{bmatrix}*\begin{bmatrix}S_k\\V_k\end{bmatrix}+\nu$
其中 $z_k=\begin{bmatrix}S_k\end{bmatrix}$ $H=\begin{bmatrix}1&0\end{bmatrix}$ $\nu$ 是测量过程的噪声

噪声处理

现在我们开始考虑两个方程中噪声的问题
对于 $\epsilon$ 和 $\nu$ 假设这两个噪声服从如下的多元高斯分布
$\LARGE p(\epsilon)\thicksim N(0,Q)\\p(\nu)\thicksim N(0,R)$
为什么噪声应当服从高斯分布呢？继续往下
我们假设系统噪声只位于速度分量上，且速度噪声的方差是一个常量0.01，那么就有
$Q=\begin{bmatrix}0&0\\0&0.01\end{bmatrix}$
这个Q表示的意思是，在模型的处理方程中，在速度上系统噪声方差为0.01，位移上的为0，二者的协方差为零，说明二者的噪声独立，互不相关

预测与更新

有了之前的说明，那么我们就要进行数据的融合工作，即通过预测值和测量值得到一个最优的估计值

定义几个值

$\hat{x'_k}$ 是预测（先验）值，即使用状态方程计算出来的值
$\hat{x_k}$ 是估计值，即用预测值和测量值融合得到的结果
$\hat{z_k}$ 是预测测量值，即把 $\hat{x'_k}$ 带入测量方程计算的预测测量值
$z_k$ 是实际的测量值

估计值计算方程

$\huge \hat{x_k}=\hat{x'_k}+K_k(z_k-\hat{z_k})\\ \qquad \quad=\hat{x'_k}+K_k(z_k-H(\hat{x'_k}))$
其中 $z_k-\hat{z_k}=z_k-H(\hat{x'_k})$ 这个东西称为残差，其实就是实际测量值与预测测量值的差

对于这个方程，我们可以从特殊情况下来看待理解它。
如果残差为零，那么说明真实测量与预测测量没有差别，那么
$\huge \hat{x_k}=\hat{x'_k}+K_k*\vec0\\即\hat{x_k}=\hat{x'_k}$ 那么说明预测值与估计值一样
如果 $K_k=0$ ，说明我们就不考虑测量值对于系统状态的影响，我们只信赖状态方程估算的数据，那么
$\huge \hat{x_k}=\hat{x'_k}+\vec0*(z_k-\hat{z_k})\\即\hat{x_k}=\hat{x'_k}$
如果 $K_k=1$ ，说明我们非常信赖测量的数据，那么
$\huge \quad\hat{x_k}=\hat{x'_k}+\vec1*(z_k-\hat{z_k})\\ =\hat{x'_k}+z_k-\hat{z_k}\\ \quad=\hat{x'_k}+z_k-H\hat{x'_k}\\$
根据匀加速直线运动的例子我们继续展开上式
$\huge\begin{bmatrix}\hat{S_k}\\\hat{V_k}\end{bmatrix}=\begin{bmatrix}\hat{S'_k}\\\hat{V'_k}\end{bmatrix}+\begin{bmatrix}S_{k测}\\0\end{bmatrix}-\begin{bmatrix}1&0\end{bmatrix}*\begin{bmatrix}\hat{S'_k}\\\hat{V'_k}\end{bmatrix}=\begin{bmatrix}S_{k测}\\\hat{V'_k}\end{bmatrix}$
由此可以看出，当 $K_k=1$ 时，我们对于测量方程的测量结果完全信任，对于能够测量到的数据，一律认为是我们的估计值
所以对于估计值计算方程。
我们可以理解为 $K_k$ 是残差的系数，我们融合的就是预测值和残差，关键就在于如何求解这个 $\huge K_k$

残差系数的求解

估计值和真实值的差距

$P_k = E[e_ke^T_k]=E[(x_k-\hat{x_k})(x_k-\hat{x_k})^T]$
这个是真实值与估计值的协防差矩阵
$e_k$ 是一个向量，它是由系统状态的变量组成的，在例子中就是由 $S$ 和 $V$ 组成，即位移和速度。那么就有

$P_k=\begin{bmatrix}E(S_{err}S^T_{err}) &E(S_{err}V^T_{err})\\E(V_{err}S^T_{err}) &E(V_{err}V^T_{err})\end{bmatrix}$

$S_{err}$ 是位移的误差， $V_{err}$ 是速度的误差，对角线上是他们各自的方差

$x_k-\hat{x_k}=x_k-(\hat {x'_k}+K_k(z_k-\hat{z_k})) \\\qquad\quad\;\;\, =x_k-(\hat {x'_k}+K_k(H_kx_k+\nu_k-H_k\hat{x'_k})) \\\qquad\quad\;\;\,=x_k-\hat{x'_k}-K_kH_kx_k-K_k\nu_k+K_kH_k\hat{x'_k} \\\qquad\quad\;\;\,=(I-K_kH_k)(x_k-\hat{x'_k})-K_k\nu_k$

此处 $\hat{z_k}=H_k\hat{x'_k}$ ，为什么没有噪声呢，博主自己理解的是，因为这个值不是真实测量的所以不引入噪声。就算如果引入了噪声，那么根据 $z_k-\hat{z_k}$ ，噪声就被消去了，噪声就没用了。博主认为应该似乎就是这种原因吧。

把 $x_k-\hat{x_k}$ 的表达式代入，直接展开,又因为 $x_k$ 与 $\nu_k$ 是相互独立的,所以有 $E[A\nu_k]=E[A]E[\nu_k]$ ， $A$ 是一个表达式，且 $E[\nu_k]=0$ ，所以只带有 $\nu_k$ 的期望项都为零
$P_k=E\begin{bmatrix}[(I-K_kH_k)(x_k-\hat{x'_k})-K_k\nu_k][(I-K_kH_k)(x_k-\hat{x'_k})-K_k\nu_k]^T\end{bmatrix} \\\quad\;\,=E\begin{bmatrix}[(I-K_kH_k)(x_k-\hat{x'_k})-K_k\nu_k][(x-\hat{x'_k})^T(I-K_kH_k)^T-\nu_k^TK_k^T]\end{bmatrix} \\\quad\;\,=E\begin{bmatrix}(I-K_kH_k)(x_k-\hat{x'_k})(x_k-\hat{x'_k})^T(I-K_kH_k)^T+K_k\nu_k\nu_k^TK_k^T\end{bmatrix} \\\quad\;\,=(I-K_kH_k)E\begin{bmatrix}(x_k-\hat{x'_k})(x_k-\hat{x'_k})^T\end{bmatrix}(I-K_kH_k)^T+K_kE\begin{bmatrix}\nu_k\nu_k^T\end{bmatrix}K_k^T$
又因为 $E\begin{bmatrix}\nu_k\nu_k^T\end{bmatrix}=R$ ，所以就有
$P_k=(I-K_kH_k)E\begin{bmatrix}(x_k-\hat{x'_k})(x_k-\hat{x'_k})^T\end{bmatrix}(I-K_kH_k)^T+K_kRK_k^T$
我们发现此时在 $P_k$ 中出现了一个期望 $E\begin{bmatrix}(x_k-\hat{x'_k})(x_k-\hat{x'_k})^T\end{bmatrix}$ ，由前面可知，这是真实值与预测值的协方差矩阵
所以有 $P'_k=E\begin{bmatrix}(x_k-\hat{x'_k})(x_k-\hat{x'_k})^T\end{bmatrix}$
$P'_k$ 是真实值与预测值的协方差矩阵
现在回到 $P_k$ 的表达式
$P_k=(I-K_kH_k)P'_k(I-K_kH_k)^T+K_kRK_k^T\\ \quad\;\,=P'_k-K_kH_kP'_k-P'_kH_k^TK_k^T+K_k(H_kP'_kH_k^T+R)K_k^T$
我们希望求到最小均方差，那么 $P_k$ 的迹（矩阵对角线元素之和，也是均方差）应该最小，所以
$tr(P_k)=tr(P'_k)-tr(K_kH_kP'_k)-tr(P'_kH_k^TK_k^T)+tr[K_k(H_kP'_kH_k^T+R)K_k^T]\\ \qquad\;\;\;\,=tr(P'_k)-2tr(K_kH_kP'_k)+tr[K_k(H_kP'_kH_k^T+R)K_k^T]$
对 $K_k$ 求偏导，此处需要用到两个矩阵微分公式
公式一：
$\frac{\partial tr(AB)}{\partial A}=B^T$
公式二：
$\frac{\partial tr(ABA^T)}{\partial A}=2AB$
$\frac{\partial tr(P_k)}{\partial K_k}\;\,=-\frac{\partial2tr(K_kH_kP'_k)}{\partial K_k}+\frac{\partial tr[K_k(H_kP'_kH_k^T+R)K_k^T]}{\partial K_k}\\=-2(H_kP'_k)^T+2K_k(HP'_kH^T+R)$
为了求得最小值，偏导应该为零，对于协方差矩阵 $P=P^T$
$0=-2(H_kP'_k)^T+2K_k(HP'_kH^T+R)$
整理可得

卡尔曼增益的表达式

$\huge K_k=P'_kH_k^T(HP'_kH^T+R)^-$
得到了 $K_k$ 的计算方法，只需求出 $P_k'$ (真实值与预测值的协方差矩阵)即可

预测值和真实值的差距

$P'_k=E\begin{bmatrix}(x_k-\hat{x'_k})(x_k-\hat{x'_k})^T\end{bmatrix}\\ \quad\;=E\begin{bmatrix}(x_k-\hat{x'_k})(x_k-\hat{x'_k})^T\end{bmatrix}\\ \quad\;=E\begin{bmatrix}(A_kx_k+B_ku_k+\epsilon_k-A_k\hat{x}_{k-1}-B_ku_k)(A_kx_k+B_ku_k+\epsilon_k-A_k\hat{x}_{k-1}-B_ku_k)^T\end{bmatrix}\\ \quad\;=E\begin{bmatrix}(A_k(x_k-\hat{x}_{k-1})+\epsilon_k)(A_k(x_k-\hat{x}_{k-1})+\epsilon_k)^T\end{bmatrix}\\ \quad\;=E\begin{bmatrix}(A_k(x_k-\hat{x}_{k-1})(A_k(x_k-\hat{x}_{k-1})^T\end{bmatrix}+E\begin{bmatrix}\epsilon_k\epsilon_k^T\end{bmatrix}$
$\huge\;\;=A_kP_{k-1}A_k^T+Q$

使用卡尔曼增益去更新估计值与真实值的差距

把卡尔曼增益表达式代入 $P_k$ 表达式
$K_k=P'_kH_k^T(HP'_kH^T+R)^-$
$P_k=P'_k-K_kH_kP'_k-P'_kH_k^TK_k^T+K_k(H_kP'_kH_k^T+R)K_k^T$
注意仅带入到第三项的 $K_k$ 中
$P_k=P'_k-K_kH_kP'_k-P'_kH_k^TK_k^T+P'_kH_k^T(HP'_kH^T+R)^-(H_kP'_kH_k^T+R)K_k^T$
$\quad\;\,=P'_k-K_kH_kP'_k$
$\quad\;\,\huge=(I-K_kH_k)P'_k$

总结

卡尔曼滤波的更新过程

1， $P_0$ 和 $x_0$ 是已知量，由 $P_0$ 计算出 $P'_1$ ，再算出 $K_1$ ，结合测量值算出 $x_1$ ，再利用 $K_1$ 更新 $P_1$
2，由 $P_1$ 计算出 $P'_2$ ，再算出 $K_2$ ，结合测量值算出 $x_2$ ，再利用 $K_2$ 更新 $P_2$
。。。。。。
n，由 $P_{n-1}$ 计算出 $P'_n$ ，再算出 $K_n$ ，结合测量值算出 $x_n$ ，再利用 $K_n$ 更新 $P_n$

需要使用的公式

$\huge \hat{x'_k}\;\,=A\hat{x}_{k-1}+Bu_k$
$\huge P'_k\,=AP_{k-1}A^T+Q$
$\huge K_k=P'_kH^T(HP'_kH^T+R)^-$
$\huge \hat{z_k}\;\;=H\hat{x'_k}+\nu$
$\huge \hat{x_k}=\hat{x'_k}+K_k(z_k-\hat{z_k})$
$\huge P_k\;=(I-K_kH)P'_k$
其中：
$\huge p(\epsilon)\thicksim N(0,Q)\\p(\nu)\thicksim N(0,R)$

例子

一辆匀速直线运动的车，从原点出发 $S_0=0m$ ，初始速度 $V_0=0m/s$ 求出车与原点的位移，加速度 $a = 2 m / s$ ，每次的测量时间间隔 $\Delta t=0.2s$ ， $Q = 0.02$ ， $R = 10$ ，对于 $P'_k$ 的初值自己设定，本例中设为 $\begin{bmatrix}0&0\\0&0\end{bmatrix}$ ，噪声也是自己设定的

import numpy as np
import matplotlib as mlp
import matplotlib.pyplot as plt

#预测方程噪声的协方差矩阵
Q=np.array([(0,0),(0,0.02)])
#测量方程噪声的方差
R=np.array([10]);
#采样时间
deltaT = 0.1
#生成所有的时间
t=np.arange(0,5,deltaT)
N=t.size
#加速度
a = 2
#真实位移
x=1/2*a*t*t
np.random.seed(0)
noise = np.random.normal(0,np.sqrt(10),N)
#生成测量数据
z=x+noise
#A,B,H矩阵
A=np.array([(1,deltaT),(0,1)])
B=np.array([(1/2*deltaT*deltaT),(deltaT)])
H=np.array([(1,0)])
#估计值
xhat=np.zeros([2,t.shape[0]])
#预测值
xhatminus=np.zeros([2,t.shape[0]])
#估计值和真实值协方差矩阵
P=np.zeros(Q.shape)
#预测值和真实值协方差矩阵
Pminus=np.zeros(Q.shape)
#单位矩阵
I=np.eye(Q.shape[0])

#进行卡尔曼滤波
for k in range(9,N):
    xhatminus[:,k]=np.dot(A,xhat[:,k-1])+np.dot(B,a)
    Pminus = np.dot(np.dot(A,P),A.T)+Q   
    K=np.dot(np.dot(Pminus,H.T),np.linalg.inv(np.dot(np.dot(H,Pminus),H.T)+R)) 
    xhat[:,k]=xhatminus[:,k]+ np.dot(K,z[k]-np.dot(H,xhatminus[:,k]))
    P=np.dot((I-np.dot(K,H)),Pminus)

plt.rcParams['font.sans-serif']=['Simhei'] 
plt.plot(z,'r',label=u'测量数据')
plt.plot(x,'g',label=u'真值')
plt.plot(xhat[0,:],'b',label=u'估计值')
plt.legend(loc = 0)
plt.show()

效果图
参考：
卡尔曼滤波 – 从推导到应用(一)
卡尔曼滤波 – 从推导到应用(二)
无人驾驶汽车系统入门（一）——卡尔曼滤波与目标追踪
 卡尔曼滤波算法详细推导

cmf8797143

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
卡尔曼滤波学习记录

卡尔曼滤波学习记录前言公式状态方程功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML 图表FLowchart流程图导出与导入导出导入前言博主是做无人驾驶车辆建图与定位...
复制链接

扫一扫