卡尔曼滤波

TeenLucifer

于 2024-07-15 22:50:08 发布

阅读量570

点赞数 8

文章标签：自动驾驶人工智能

本文链接：https://blog.csdn.net/TeenLucifer/article/details/140451283

版权

卡尔曼滤波

数据融合例子

卡尔曼滤波是一个数据融合的过程，先验数据和后验数据融合，即找到一个合适的权重，取两个数据的加权和。

举一个简单的例子直观理解（来源）：用两个秤去称同一个物体，得到同一个物体的两个重量和标准差（符合正态分布）为：
$z_1 = 30g \quad \sigma_1 = 2g\\ z_2 = 32g \quad \sigma_2 = 4g$

图1 数据融合例子

如上图所示，但是这两个值都是量测值，都是用秤称出来的，都存在误差，并不是物体的真实重量。问题就在于怎么找到物体的真实的重量值，图中绿色线表示的值。凭感觉应该在30-32之间，但具体是多少呢。就需要对这两个量测值进行加权求和：
$\hat{z} = z_1 + k(z_2 - z_1)$
式中， $\hat{z}$ 表示对物体真实重量值的估计值，由 $z_1$ 和 $z_2$ 加权而来； $k$ 表示加权权重， $k = 0$ 时表示完全相信量测值 $z_1$ ， $k = 1$ 时表示完全相信量测值 $z_2$ 。一般来说是取一个中间值，卡尔曼滤波的目的就是确定这个中间值，使估计值 $\hat{z}$ 尽可能接近真值。其思想很简单，假如第一个秤误差小一点，那么更偏向于相信 $z_1$ ， $k$ 值小一点；假如第二个秤误差小一点，那么更偏向于相信 $z_2$ ， $k$ 值大一点。这里就需要引入协方差阵来量化地描述每个秤的误差大小。

卡尔曼滤波的思想

根据马斯克常讲的第一性原理，做一个事之前要知道它到底是做什么的。对于这里的卡尔曼滤波来讲，就是确定 $\hat{z} = z_1 + k(z_2 - z_1)$ 这式子中的加权权重 $k$ 是多少，能够通过有限的量测和预测让估计值 $\hat{z}$ 尽可能接近真值。那么核心思想就是如何找最优权重以及如何定义最优。

找最优权重

$\hat{x}_k = \hat{x}_k^- + G(H^{-1}z_k - \hat{x}_k^-)$
可以令 $G=K_kH$ （这样就避免了矩阵求逆，总能找到一个 $K_k$ ，使这个式子成立），那么上面的公式就变成了：
$\hat{x}_k = \hat{x}_k^- + K_k(z_k - H\hat{x}_k^-) \tag{1}$
这里的 $K_k$ 就是要找的最优权重，给预测值和量测值不同的权重，使得估计值 $\hat{x}_k$ 最优。

如何定义最优

卡尔曼滤波中最优的定义，是让真值与估计值误差的方差之和最小，这样就能让估计值尽量的平滑，实现滤波。方差之和即是协方差矩阵的对角线之和，这里有一个迹的概念可以直接表示对角线元素之和： $\sum\limits_{i=0}^{n} a_{ii}$ ，表示矩阵 $A$ 对角线元素之和。

定义 $k$ 时刻的误差协方差阵为 $P_k$ ， $tr(P_k)$ 表示方差之和，期望取到最优的分配权重 $K_k$ 使方差之和最小，也就是迹最小，使误差状态 $e_k$ 方差趋于0，让估计值尽量平滑。

用数学语言表示上述思想

系统定义

$\begin{aligned} &x_k = Ax_{k-1} + Bu_{k-1} + w_{k-1}\\ &z_k = Hx_k + v_{k} \end{aligned}$
式中， $x_k$ 表示状态真值，是无法得到的，只能通过量测或者估算的手段得到估计值； $A, B$ 表示系统矩阵，可以看现代控制理论； $w_{k-1}\sim N(0, Q)$ 表示服从高斯分布，均值为0协方差为 $Q$ 的系统噪声，因为噪声是多维的所以用协方差阵而不是方差； $z_k$ 表示系统状态的量测输出，即通过传感器什么的测量到的值； $H$ 表示量测矩阵，表示系统状态 $x_k$ 和量测值之间的变换关系； $v_{k} \sim N(0, R)$ 表示服从高速分布，均值为0协方差为 $R$ 量测噪声，表示传感器的特性。

推导误差协方差阵

状态的估计误差 $e_k$ 为：
$\begin{aligned} e_k &= x_k - \hat{x}_k\\ &= x_k - (\hat{x}_k^- + K_k(z_k - H\hat{x}_k^-))\\ &= x_k - \hat{x}_k^- - K_kH(x_k - \hat{x}_k^-) + K_kv_k\\ &= (I - K_kH)(x_k - \hat{x}_k^-) + K_kv_k\\ &= (I - K_kH)e_k^- + K_kv_k \end{aligned}$
式中， $I$ 表示单位阵； $\hat{x}_k$ 表示状态的估计值，就是我们最后要求的值； $e_k^- = x_k - x_k^-$ 表示先验状态的估计误差， $x_k^-$ 表示先验的预测状态。

误差的协方差阵为：
$\begin{aligned} P_k = E(e_ke_k^T) &= E[((I - K_kH)e_k^- + K_kv_k)((I - K_kH)e_k^- + K_kv_k)^T]\\ &= E[(I - K_kH)e_k^- e_k^{-T}(I - K_kH)^T] + E[(I - K_kH)e_k^-v_k^TK_k^T] + E[K_kv_ke_k^{-T}(I-K_kH)^T] + E[K_kv_kv_k^TK_k^T]\\ &= (I - K_kH)E[e_k^- e_k^{-T}](I - K_kH)^T + (I - K_kH)E[e_k^-v_k^T]K_k^T + K_kE[v_ke_k^{-T}](I - K_kH)^T + K_kE[v_kv_k^T]K_k^T\\ &= (I - K_kH)P_k^-(I - K_kH)^T + K_kRK_k \end{aligned}$
式中， $E(\cdot)$ 表示对括号内的变量求期望。这里 $P_k^- = E[e_k^-e_k^{-T}]$ ，表示先验状态误差协方差；因为 $e_k^-$ 和 $v_k$ 不相关，所以其协方差为 $E[e_k^-v_k^T] = E[v_ke_k^{-T}] = 0$ ； $R = E[v_kv_k^T]$ 为量测噪声的协方差阵。那么上面的误差协方差阵 $P_k$ 为：
$\begin{aligned} P_k = E(e_ke_k^T) &= (I - K_kH)P_k^-(I - K_kH)^T + K_k R K_k^T\\ &= P_k^- - K_kHP_k^- - P_k^-H^TK_k^T + K_kHP_k^-H^TK_k^T + K_kRK_k^T \tag{2} \end{aligned}$
至此，定义了目标，让协方差阵 $P_k$ 的迹最小，同时也给出了协方差阵 $P_k$ 的计算方式。

求解最优 $K_k$ 使 $tr(P_k)$ 最小

卡尔曼滤波也是一个优化的过程，是将误差协方差矩阵 $P_k$ 的迹（各状态量误差的方差之和）作为优化目标函数，卡尔曼增益 $K_k$ 作为决策变量，找到最优的 $K_k$ 使误差方差之和最小。根据式(2)， $P_k$ 的迹为：
$tr(P_k) = tr(P_k^-) - 2tr(K_kHP_k^-) + tr(K_kHP_k^-H^TK_k^T) + tr(K_kRK_k^T)$

令 $tr(P_k)$ 关于 $K_k$ 的偏导为0，可以求得 $tr(P_k)$ 关于 $K_k$ 的极值点，一般我们期望这是一个极小值点，可以求二阶偏导来看具体情况，如果二阶偏导大于0，那么就是极小值。网上很多资料都是直接给一阶偏导为0的点，没说明二阶偏导的正负情况，即并未证明是极小值。从结论来说这边一阶偏导为0肯定是极小值，如何证明好像没找到严格的推导qAq。（文章最后我放了简单的一些讨论，但不知道咋证明，有大佬说下嘛。）

注：对迹求导的公式
$\frac{\partial tr(AB)}{\partial A} = B^T, \frac{\partial tr(ABA^T)}{\partial A} = 2AB$

令 $tr(P_k)$ 关于 $K_k$ 的偏导为0，即可求得 $K_k$ 的最优值：
$\frac{\partial tr(P_k)}{\partial K_k} = -2(HP_k^-)^T + 2K_kHP_k^-H^T + 2K_kR = 0$

$\begin{aligned} K_k &= \frac{P_k^- H^T}{HP_k^- H^T + R}\\ &= P_k^-H^T(HP_k^- H^T + R)^{-1} \tag{3} \end{aligned}$

把式(3)代入式(2)中，可以得到误差协方差阵 $P_k$ 的更新公式：
$\begin{aligned} P_k &= P_k^- - K_kHP_k^- - P_k^-H^TK_k^T + K_kHP_k^-H^TK_k^T + K_kRK_k^T\\ &= P_k^- - K_kHP_k^- - P_k^-H^TK_k^T + K_k(HP_k^-H^T + R)K_k^T\\ &= P_k^- - K_kHP_k^- - P_k^-H^TK_k^T + P_k^- H^TK_k^T\\ &= (I - K_kH)P_k^- \end{aligned}$
至此，找到了最优的分配权重 $K_k$ ，即卡尔曼增益。

计算先验协方差阵 $P_k^-$

在上面卡尔曼增益 $K_k$ 和误差协方差阵 $P_k$ 的计算中，还有先验协方差阵 $P_k^-$ 未知。先验协方差阵就是真值 $x_k$ 与先验状态 $\hat{x}_k^-$ 之间的误差协方差阵。前面已经定义估计误差 $e_k = x_k - \hat{x}_{k-1}$ ，那么先验状态误差 $e_k^-$ 为：
$x_k = Ax_{k-1} + Bu_{k-1} + w_{k-1}\\$

$\hat{x}_k^- = A\hat{x}_{k-1} + Bu_{k-1} \tag{4}$

$\begin{aligned} e_k^- = x_k - \hat{x}_k^- &= A(x_{k-1} - \hat{x}_{k-1}) + w_{k-1}\\ &= Ae_{k-1}+w_{k-1} \end{aligned}$
其中 $\hat{x}_k^-$ 为状态的预测值，即通过系统模型 $A, B$ 矩阵以及上一时刻的估计状态 $\hat{x}_{k-1}$ 预测出来这一时刻的值。我们最终要赋予这个值和量测值 $z_k$ 不同的权重计算这一时刻的估计状态 $\hat{x}_k$ 。

那么先验协方差阵为：
$\begin{aligned} P_k^- &= E(e_k^-e_k^{-T})\\ &= E[(Ae_{k-1} + w_{k-1})(Ae_{k-1} + w_{k-1})^T]\\ &= E[Ae_{k-1}e_{k-1}^TA^T + Ae_{k-1}w_{k-1} + w_{k-1}^Te_{k-1}^TA^T + w_{k-1}w_{k-1}^T]\\ &= E[Ae_{k-1}e_{k-1}^TA^T] + E[Ae_{k-1}w_{k-1}] + E[w_{k-1}^Te_{k-1}^TA^T] + E[w_{k-1}w_{k-1}^T]\\ &= AE[e_{k-1}e_{k-1}^T]A^T + E[w_{k-1}w_{k-1}^T]\\ &= AP_{k-1}A^T + Q \end{aligned} \tag{5}$
到这里为止，把式(2)~(5)代入到式(1)中就能完成对当前状态真值 $x_k$ 的估计，实现卡尔曼滤波，得到估计值 $\hat{x}_{k}$

写在最后

列一下网上能查到的卡尔曼滤波5条公式，结论：
$\begin{aligned} &\hat{x}_k^- = A\hat{x}_{k-1} + Bu_{k-1}\\ &P_k^- = AP_{k-1}A^T + Q\\ &K_k = \frac{P_k^- H^T}{HP_k^- H^T + R}\\ &\hat{x}_k = \hat{x}_k^- + K_k(z_k - H_k\hat{x}_k^-)\\ &P_k = (I - K_kH_k)P_k^- \end{aligned}$
上面的推导过程没有按照这5条公式的顺序来，而是从最终目的出发，以得到状态的估计值 $\hat{x}_k$ 为目标，先推导与计算 $\hat{X}_k$ 最相关的卡尔曼增益 $K_k$ ，推导过程中引出了误差协方差阵 $P_k$ 的计算，在计算 $P_k$ 过程中又引出了先验状态 $\hat{x}_k^-$ 和先验误差协方差阵 $P_k^-$ 的计算方式，最终完成卡尔曼滤波的推导。

接下来讨论一下卡尔曼增益计算时候的二阶偏导的性质，我们期望其二阶偏导为正，那么一阶偏导为0算出来的 $K_k$ 能让误差方差之和最小，即达到最优。二阶偏导为：
$\frac{\partial^2 tr(P_k)}{\partial K_k^2} = 2HP_k^-H^T + 2R$
上面这个二阶偏导没法直接考察正定还是负定，那么从定义来看 $P_k^-=E[x_k^- x_k^{-T}]$ 为先验状态协方差阵， $R$ 为量测噪声协方差阵，在网上查了一下协方差阵的正定性，说协方差阵一定半正定，即从定义来说 $P_k^- \geq 0$ ， $P_k \geq 0$ ， $\geq 0$ ， $\geq 0$ 。那么这里的二阶偏导至少就是半正定的，一般来说也不会取到半正定的那个等于0的值，因此取一阶偏导为0时的 $K_k$ 能让 $P_k$ 取到极小值。这个说明过程非常不严谨，但至少对取一阶偏导为0时取到极小值进行了补充说明，不知道有没有更严格一点的证明。

我觉得如何说明 $P_k$ 和 $P_k^-$ 是正定的才是卡尔曼滤波的本质，因为这里决定了卡尔曼滤波状态的最优性和收敛性。

但是对于把卡尔曼滤波作为工具使用来说，掌握5条公式和个变量的含义就够了，再进一步也就是把上面的推导过程消化了，对于工程使用来说足够了。

TeenLucifer

关注

8
点赞
踩
24

收藏

觉得还不错? 一键收藏
0
评论
卡尔曼滤波

卡尔曼滤波数据融合例子卡尔曼滤波是一个数据融合的过程，先验数据和后验数据融合，即找到一个合适的权重，取两个数据的加权和。举一个简单的例子直观理解（来源）：用两个秤去称同一个物体，得到同一个物体的两个重量和标准差（符合正态分布）为：z1=30gσ1=2gz2=32gσ2=4gz_1 = 30g \quad \sigma_1 = 2g\\z_2 = 32g \quad \sigma_2 = 4gz1=30gσ1=2gz2=32gσ2=4g 图1
复制链接

扫一扫