卡尔曼滤波原理详解

Blank_3

已于 2023-08-25 16:46:43 修改

阅读量202

点赞数 1

文章标签：笔记算法机器学习

于 2023-08-25 16:45:51 首次发布

本文链接：https://blog.csdn.net/Blank_3/article/details/132477465

版权

卡尔曼滤波原理详解

举例引入
状态空间与观测器
卡尔曼滤波原理
卡尔曼滤波流程

关键词：递归、最优化、观测器

举例引入

对一个端口的电压，我们需要获取他的电压值，因此我们对其进行了多次测量，得到该端口电压的多个测量值（观测值） $y_1,y_2,...,y_k$ 。

由于我们的测量设备存在的误差，这些测量值并不完全相同，那如何确定端口电压的真实值呢？

我们可以很容易的想到，取所有测量值的平均值为我们认为的真实值（估计值）。
则有估计值 $\hat{x_k} = \frac{1}{k} (y_1 + y_2 + ...+ y_k)$
对该式进行变式操作：
$\begin{split} \hat{x_k} & = \frac{1}{k}(y_1 + y_2 + ...+y_{k-1})+\frac{1}{k}y_k \\ & = \frac{k-1}{k}\frac{1}{k-1}(y_1+y_2+...+y_{k-1}) + \frac{1}{k}y_k \\ & = \frac{k-1}{k}\hat{x_{k-1}} + \frac{1}{k}y_k \\ & = \hat{x_{k-1}} + \frac{1}{k}(y_k - \hat{x_{k-1}}) \end{split}$

可以看到，估计值 $\hat{x_k}$ 的表达式为一个递归式
当我们把上式第二项的系数 $\frac{1}{k}$ 改为卡尔曼增益 $K_k$ ，就得到了一个卡尔曼滤波的基本公式：
$\hat{x_k} =\hat{x_{k-1}} + K_k(y_k - \hat{x_{k-1}})$

状态空间与观测器

观测器，这是一个现代控制理论的概念。所谓观测器，就是根据系统的可测量的输出信号，去估计系统不可直接测量的状态信号。
也可以认为观测器就是一种算法，一种通过测量值，去估计不可测量的状态值的估计算法，卡尔曼滤波就是这样一种算法。

在构建观测器之前，需要先对当前系统进行建模，构建出其状态空间方程。
状态空间方程分为状态方程与观测方程，状态方程一般为状态量的递归式，他表示系统状态随时间的迭代规律，观测方程一般为观测量与状态量的映射关系
一般的线性系统状态空间方程的矩阵形式可以表示为：
$\begin{split} X_k &= AX_{k-1}+BU_{k-1}+w_{k-1}\\ Y_k &= CX_k + D U_k + v_k\\ \end{split}$ 其中 $X_k$ 为状态量； $Y_k$ 为观测量； $U_k$ 为输入量； $w_k$ 为过程噪声，表示系统未建模部分和系统扰动； $v_k$ 为观测噪声，表示测量传感器存在的误差。

卡尔曼滤波原理

对于上述状态空间方程
$\begin{split} X_k &= AX_{k-1}+BU_{k-1}+w_{k-1}\tag{1}\\ Y_k &= CX_k + D U_k + v_k\\ \end{split}$ 给出假设条件： $w_k$ 与 $v_k$ 相互独立且均服从高斯分布，有 $w_k \sim (0, Q_k)$ ， $v_k\sim(0, R_k)$

根据状态空间方程我们可以直接给出两个估计结果：
先验估计：
$\hat{X_k^-} = A\hat{X_{k-1}}+BU_{k-1}\tag{2}$
观测估计：
$\hat{X_{k,obs}} = C^{-1}(Y_k - DU_k)\tag{3}$
由于噪声的存在，上述两个估计都不准确，卡尔曼滤波器要做的事就是借助这两个不准确的估计，得到一个更为准确的估计。

根据举例引入给出的卡尔曼滤波基本公式可得：
后验估计： $\hat{X_k} = \hat{X_k^-} + G_k(\hat{X_{k,obs} - \hat{X_k^-}})$
我们一般令 $G_k = K_kC$ ，再把 $\hat{X_{k,obs}}$ 代入得到：
$\hat{X_k} = \hat{X_k^-} + K_k(Y_k - DU_k - C\hat{X_k^-})\tag{4}$

此时的算法目标变成：找到一个 $K_k$ ，使得 $\hat{X_k}$ 最接近状态量的真实值 $X_k$ 。 $\begin{split} => &min\{e_k = X_k - \hat{X_k}\} \qquad e_k\sim(0, P_k) \\ => &min\{\sigma^2(e_k)\} \\ => &min\{tr(P_k)\} \end{split}$

卡尔曼增益 $K_k$ 表达式的数学推导
跳过
所定义的 $e_k = X_k - \hat{X_k}$
代入Eq.(4),(1)得：
$e_k = X_k - \hat{X_k^-} - K_k(CX_k + v_k - CX_k^-)$
定义： $e_k^- = X_k - X_k^-$
则有：
$\begin{split} e_k &= e_k^- -K_k(Ce_k^- + v_k)\tag{5}\\ &=(I-K_kC)e_k^- - K_kv_k \end{split}$

协方差矩阵 $P_k$ 有计算公式 $P_k = E[e_ke_k^T]$
代入Eq.(5)得：
$\begin{split} P_k = &E[e_ke_k^T]\\ = &E[\{(I-K_kC)e_k^--K_kv_k\}\{(I-K_kC)e_k^--K_kv_k\}^T]\\ = &E[\{(I-K_kC)e_k^--K_kv_k\}\{e_k^{-T}(I-K_kC)^T - v_k^TK_k^T\}]\\ = &E[(I-K_kC)e_k^-e_k^{-T}(I-K_kC)^T] -E[(I-K_kC)e_k^-v_k^TK_k^T] -E[K_kv_ke_k^{-T}(I-K_kC)^T] +E[K_kv_kv_k^TK_k^T]\\ = &(I-K_kC)E[e_k^-e_k^{-T}](I-K_kC)^T -(I-K_kC)E[e_k^-]E[v_k^T]K_k^T -K_k E[v_k]E[e_k^{-T}](I-K_kC)^T +K_kE[v_kv_k^T]K_k^T \end{split}$

$v_k,e_k^-$ 的均值都为0，即 $E[v_k]=0,E[e_k^-]=0$ ;
$E[e_k^-e_k^{-T}]$ 即为 $e_k^-$ 的协方差矩阵， $P_k^-$
$E[v_kv_k^T]$ 即为 $v_k$ 的协方差矩阵， $R_k$

则有：
$\begin{split} P_k &= (I-K_kC)P_k^-(I-K_kC)^T - 0 - 0 + K_kR_kK_k^T\\ &= (P_k^- - K_kCP_k^-)(I-C^TK_k^T) + K_kR_kK_k^T\\ &= P_k^- - P_k^-C^TK_k^T - K_kCP_k^- + K_kCP_k^-C^TK_k^T + K_kR_kK_k^T\tag{6} \end{split}$

得到 $P_k$ 的表达式，计算它的迹 $tr(P_k)$
$tr(P_k) = tr(P_k^-) -tr(P_k^-C^TK_k^T) -tr(K_kCP_k^-) +tr(K_kCP_k^-C^TK_k^T) +tr(K_kR_kK_k^T)$

要求得 $tr(P_k)$ 的最小值，计算其极小值点，即对 $K_k$ 导数为0的点

引理：矩阵计算公式有： $\frac{d\,tr(AB)}{d\,A} =B^T \qquad \frac{d\,tr(ABA^T)}{d\,A}=2AB$

观察 $tr(P_k)$ 表达式可知：式子第二项与第三项互为转置，因此他们的迹相等；第后四项均符合引理给出公式对应的形式
所以有：
$\begin{split} \frac{d\,tr(P_k)}{d\,K_k} = 0 - 2P_k^{-T}C^T + 2K_kCP_k^-C^T + 2K_kR_k = 0\\ 2K_kCP_k^-C^T + 2K_kR_k=2P_k^{-T}C^T\\ \end{split}$

因为协方差矩阵均为对称矩阵，所以 $P_k^{-T} = P_k^-$
得到 $tr(P_k)$ 为最小值时，卡尔曼增益 $K_k$ 的表达式：
$K_k=P_k^-C^T(CP_k^-C^T+R_k)^{-1} \tag{7}$

可以发现，卡尔曼增益 $K_k$ 的表达式中，先验估计的协方差矩阵 $P_k^-$ 还没有得到，因此需要计算先验估计的协方差矩阵 $P_k^-$ 的表达式。

先验协方差矩阵 $P_k^-$ 表达式的数学推导
跳过
所定义的 $e_k^- = X_k - \hat{X_k^-}$
代入Eq.(1),(2)得：
$\begin{split} e_k^- &= AX_{k-1} + BU_{k-1} + w_{k-1} - A\hat{X_{k-1}} - BU_{k-1}\\ &=Ae_{k-1} + w_{k-1} \tag{8} \end{split}$
协方差矩阵 $P_k^-$ 有计算公式 $P_k^- = E[e_k^-e_k^{-T}]$
代入Eq.(8)得：
$\begin{split} P_k^- &= E[e_k^-e_k^{-T}]\\ &= E[(Ae_{k-1} + w_{k-1})(Ae_{k-1} + w_{k-1})^T]\\ &= E[(Ae_{k-1} + w_{k-1})(e_{k-1}^TA^T+w_{k-1}^T)]\\ &= AE[e_{k-1}e_{k-1}^T]A^T + AE[e_{k-1}]E[w_{k-1}^T]+E[w_{k-1}]E[e_{k-1}^T]A^T+E[w_{k-1}w_{k-1}^T] \end{split}$ $w_k,e_k$ 的均值都为0，即 $E[w_k]=0,E[e_k]=0$ ;
$E[e_ke_k^T]$ 即为 $e_k$ 的协方差矩阵， $P_k$
$E[w_kw_k^T]$ 即为 $w_k$ 的协方差矩阵， $Q_k$

则有：
$P_k^- = AP_{k-1}A^T + 0 + 0 + Q_{k-1}$
即：
$P_k^- = AP_{k-1}A^T + Q_{k-1}\tag{9}$

由Eq.(9)可知，计算 $P_k^-$ 需要上一时刻的后验协方差矩阵 $P_{k-1}$ ，因此还需要后验协方差矩阵 $P_k$ 的表达式以时刻更新 $P_k$ 。
Eq.(6)给出了 $P_k$ 的表达式：
$P_k= P_k^- - P_k^-C^TK_k^T - K_kCP_k^- + K_kCP_k^-C^TK_k^T + K_kR_kK_k^T$
将上式第四项和第五项合并得： $K_k(CP_k^-C^T+R_k)K_k^T$
代入Eq.(7) $K_k$ 的表达式）得： $P_k^-C^TK_k^T$ ，可与第二项相消。
因此得到后验协方差矩阵 $P_k$ 的更新式为：
$P_k = (I - K_kC)P_k^-\tag{10}$

卡尔曼滤波流程

整理Eq.(1),(2),(4),(7),(9),(10)可得卡尔曼滤波算法的完整流程

状态空间方程：

$\begin{split} X_k &= AX_{k-1}+BU_{k-1}+w_{k-1}\\ Y_k &= CX_k + D U_k + v_k\\ \end{split}$

假设条件：

$\qquad w_k$ 与 $v_k$ 相互独立且均服从高斯分布，有 $w_k \sim (0, Q_k)$ ， $v_k\sim(0, R_k)$

初始条件：

$\begin{split} \hat{X_0} &= E[X_0]\\ P_0 &= E[(X_0-\hat{X_0})(X_0-\hat{X_0})^T] \end{split}$

循环：

$\begin{split} 预测： \hat{X_k^-}& = A\hat{X_{k-1}}+BU_{k-1}\\ P_k^- &= AP_{k-1}A^T + Q_{k-1}\\ \\ 卡尔曼增益：K_k &= P_k^-C^T(CP_k^-C^T+R_k)^{-1}\\ \\ 校正：\hat{X_k} &= \hat{X_k^-} + K_k(Y_k - C\hat{X_k^-} - DU_k)\\ P_k &= (I - K_kC)P_k^- \end{split}$