卡尔曼滤波器的数学推导

最新推荐文章于 2024-04-25 12:36:14 发布

木独

最新推荐文章于 2024-04-25 12:36:14 发布

阅读量905

点赞数 4

分类专栏：机器人状态估计文章标签：卡尔曼滤波器状态估计数学推导

本文链接：https://blog.csdn.net/RoboChengzi/article/details/105850925

版权

机器人同时被 2 个专栏收录

16 篇文章 17 订阅

订阅专栏

状态估计

7 篇文章 1 订阅

订阅专栏

前言：这可能是网上最数学化的推导了，相较于其他的推导方法在数学上更加完备，这意味着对于其他的非线性滤波器如EKF或者信息滤波器IF很多其他地方都可以采用同样的方法进行推导，一通百通。本文的卡尔曼滤波器的推导从最基础的概率论中的贝叶斯准则和全概率公式推起，一步一步的完成卡尔曼滤波器，适合对卡尔曼有一定概念上的理解希望深入学习滤波器方法的同学。

卡尔曼滤波算法

$\bar{\mu}_t = A_t \mu_{t-1} + B_t u_t$
$\bar{\Sigma}_t = A_t \Sigma_{t-1} A_t^T + R_t$
$K_t = \bar{\Sigma}_t C_t^T(C_t \bar{\Sigma}_t C_t^T + Q_t)^{-1}$
$\mu_t = \bar{\mu}_t + K_t (z_t-C_t \bar{\mu}_t)$
$\Sigma_t = (I-K_t C_t)\bar{\Sigma}_t$

推导过程：

先验条件

贝叶斯准则：
$p(x|y,z)=\frac{p(y|x,z)p(x|z)}{p(y|z)}$
全概率公式：
$\int p(x|y)p(y) dy$
马尔可夫性：认为 $x_{t-1}$ 是 $z_{t-1}$ 、 $u_{t-1}$ 的最优估计

贝叶斯滤波器推导

$p(x_t|z_{1:t},u_{1:t})=p(x_t|z_t,z_{1:t-1},u_{1:t}) (套用贝叶斯准则) \\ =\frac{p(z_t|x_t,z_{1:t-1},u_{1:t})p(x_t|z_{1:t-1},u_{1:t})}{p(z_t|z_{1:t-1},u_{1:t})}(分母与x_t无关)\\ =\eta p(z_t|x_t,z_{1:t-1},u_{1:t})p(x_t|z_{1:t-1},u_{1:t}) (马尔可夫性)\\ =\eta p(z_t|x_t)p(x_t|z_{1:t-1},u_{1:t}) (区分先验后验) \\$
对于先验分布 $p(x_t|z_{1:t-1},u_{1:t})$ 带入全概率公式
$\overline{bel}(x_t) = p(x_t|z_{1:t-1},u_{1:t}) \\ = \int p(x_t|x_{t-1},z_{1:t-1},u_{1:t})p(x_{t-1}|z_{1:t-1},u_{1:t})d x_{t-1}$
最终得到先验和后验公式

先验：
$\overline{bel}(x_t) = \int p(x_t|x_{t-1},z_{1:t-1},u_{1:t})p(x_{t-1}|z_{1:t-1},u_{1:t})d x_{t-1}$
后验：
$bel(x_t)=\eta p(z_t|x_t)\overline{bel}(x_t)$

卡尔曼滤波器推导

根据贝叶斯滤波器带入线性的模型，推导得到卡尔曼滤波器。

模型

预测方程：
$x_t=A_t x_{t-1} + B_t u_t + \epsilon_t$
$x_{t}=\left(\begin{array}{c} x_{1, t} \\ x_{2, t} \\ \vdots \\ x_{n, t} \end{array}\right) \boldsymbol{u}_{t}=\left(\begin{array}{c} u_{1, t} \\ u_{2, t} \\ \vdots \\ u_{m, t} \end{array}\right)$

观测方程：
$z_{t}=C_{t} x_{t}+\delta_{t}$

预测

根据贝叶斯滤波器的先验公式
$\overline{\mathrm{bel}}\left(x_{t}\right)=\int \underbrace{p\left(x_{t} | x_{t-1}, u_{t}\right)}_{\sim N\left(x_{t} ; A_{t} x_{t-1}+B_{t} u_{t}, R_{t}\right)} \underbrace{\mathrm{bel}\left(x_{t-1}\right)}_{\sim N\left(x_{t-1} ; \mu_{t-1}, \Sigma_{t-1}\right)} \mathrm{d} x_{t-1}$
其中，t-1时刻 $bel(x_{t-1})$ 的概率分布为高斯分布，均值为 $\mu_{t-1}$ ，方差为 $\Sigma_{t-1}$ 。

$\overline{bel}(x_t) = \eta \int exp \left \{ -\frac{1}{2} (x_t-A_t x_{t-1}-B_t u_t)^TR_{t}^{-1}(x_t-A_t x_{t-1}-B_t u_t)\right\}exp\left \{ -\frac{1}{2}(x_{t-1}-\mu_{t-1})^T \Sigma_{t-1}^{-1}(x_{t-1}-\mu_{t-1})\right\}$
仅考虑指数部分，记为 $\overline{bel}(x_t)=\eta \int exp\{-L_t \}dx_{t-1}$ ,其中
$L_t = \frac{1}{2} (x_t-A_t x_{t-1}-B_t u_t)^TR_{t}^{-1}(x_t-A_t x_{t-1}-B_t u_t) + \frac{1}{2}(x_{t-1}-\mu_{t-1})^T \Sigma_{t-1}^{-1}(x_{t-1}-\mu_{t-1})$
对于 $x_{t-1}$ 的积分的计算则考虑到概率分布在整个空间中积分为常数，由于 $L_t$ 是关于$x_{t-1}的二次型，因此关于其的分布为高斯分布。高斯分布的计算只需要求一阶导数为零即可得到均值，求二阶导数得到方差，因此求导如下：

$\frac{\partial L_{t}}{\partial x_{t-1}}=-A_t^T R_t^{-1}(x_t-A_t x_{t-1}-B_t u_t) + \Sigma_{t-1}^{-1}(x_{t-1}-\mu_{t-1})$
$\frac{\partial^2 L_{t}}{\partial x_{t-1}^2}=A_t^T R_t^{-1}A_t + \Sigma_{t-1}^{-1} =: \Psi _{t}^{-1}$
令一阶导数为零有
$A_t^T R_t^{-1}(x_t-A_t x_{t-1}-B_t u_t) = \Sigma_{t-1}^{-1}(x_{t-1}-\mu_{t-1})\\ A_t^T R_t^{-1}x_t-A_t^T R_t^{-1} A_t x_{t-1}-A_t^T R_t^{-1} B_t u_t = \Sigma_{t-1}^{-1}x_{t-1}-\Sigma_{t-1}^{-1} \mu_{t-1}\\ A_t^T R_t^{-1}x_t-A_t^T R_t^{-1} B_t u_t +\Sigma_{t-1}^{-1} \mu_{t-1} = \Sigma_{t-1}^{-1}x_{t-1}+A_t^T R_t^{-1} A_t x_{t-1}\\ x_{t-1}= \frac{A_t^T R_t^{-1}x_t-A_t^T R_t^{-1} B_t u_t +\Sigma_{t-1}^{-1} \mu_{t-1}}{\Sigma_{t-1}^{-1}+A_t^T R_t^{-1} A_t}\\$
定义二次型函数如下：

$L_t(x_{t-1},x_t)=\frac{1}{2}(x_{t-1}-\frac{A_t^T R_t^{-1}x_t-A_t^T R_t^{-1} B_t u_t +\Sigma_{t-1}^{-1} \mu_{t-1}}{\Sigma_{t-1}^{-1}+A_t^T R_t^{-1} A_t})^T\Psi^{-1}(x_{t-1}-\frac{A_t^T R_t^{-1}x_t-A_t^T R_t^{-1} B_t u_t +\Sigma_{t-1}^{-1} \mu_{t-1}}{\Sigma_{t-1}^{-1}+A_t^T R_t^{-1} A_t})$
有 $det(2\pi\Psi_t)^{\frac{1}{2}}\int exp\{L_t(x_t,x_{t-1})\}dx_{t-1}=1$ ,因此只要将原式转换为 $L_t = L_t(x_t,x_{t-1}) + L_t(x_t)$ 即可将积分去掉。
$\overline{bel}(x_t)=\eta \int exp\{-L_t \}dx_{t-1}\\ =\eta \int exp\{-L_t(x_t) -L_t(x_t,x_{t-1}) \}dx_{t-1}\\ =\eta exp\{-L_t(x_t) \}\int exp\{-L_t(x_t,x_{t-1}) \}dx_{t-1}\\ =\eta exp\{-L_t(x_t) \\$
因此只需要考虑 $L_t(x_t)$ 的分布即可，由于对于 $x_t$ 是二次型，为高斯分布，可以采用求一阶导数和二阶导数的方法求得其均值和方差。
$L_t(x_t) = L_t - L_t(x_t,x_{t-1})\\ =\frac{1}{2} (x_t-A_t x_{t-1}-B_t u_t)^TR_{t}^{-1}(x_t-A_t x_{t-1}-B_t u_t) + \frac{1}{2}(x_{t-1}-\mu_{t-1})^T \Sigma_{t-1}^{-1}(x_{t-1}-\mu_{t-1}) - \frac{1}{2}(x_{t-1}-\frac{A_t^T R_t^{-1}x_t-A_t^T R_t^{-1} B_t u_t +\Sigma_{t-1}^{-1} \mu_{t-1}}{\Sigma_{t-1}^{-1}+A_t^T R_t^{-1} A_t})^T\Psi^{-1}(x_{t-1}-\frac{A_t^T R_t^{-1}x_t-A_t^T R_t^{-1} B_t u_t +\Sigma_{t-1}^{-1} \mu_{t-1}}{\Sigma_{t-1}^{-1}+A_t^T R_t^{-1} A_t})$
由于该式子的化简过于繁琐，就不化简直接求导数

一阶导数：
$\frac{\partial L_t(x_t)}{\partial x_t} = R_t^{-1} (x_t-A_t x_{t-1}-B_t u_t) + \frac{ R_t^{-1}A_t}{\Sigma_{t-1}^{-1}+A_t^T R_t^{-1} A_t} \Psi^{-1} (x_{t-1}-\frac{A_t^T R_t^{-1}x_t-A_t^T R_t^{-1} B_t u_t +\Sigma_{t-1}^{-1} \mu_{t-1}}{\Sigma_{t-1}^{-1}+A_t^T R_t^{-1} A_t})\\ =R_t^{-1} (x_t-A_t x_{t-1}-B_t u_t) + \frac{ R_t^{-1}A_t}{\Sigma_{t-1}^{-1}+A_t^T R_t^{-1} A_t} (A_t^T R_t^{-1}A_t + \Sigma_{t-1}^{-1}) (x_{t-1}-\frac{A_t^T R_t^{-1}x_t-A_t^T R_t^{-1} B_t u_t +\Sigma_{t-1}^{-1} \mu_{t-1}}{\Sigma_{t-1}^{-1}+A_t^T R_t^{-1} A_t})\\ =R_t^{-1} (x_t-A_t x_{t-1}-B_t u_t) + R_t^{-1} A_t (x_{t-1}-\frac{A_t^T R_t^{-1}x_t-A_t^T R_t^{-1} B_t u_t +\Sigma_{t-1}^{-1} \mu_{t-1}}{\Sigma_{t-1}^{-1}+A_t^T R_t^{-1} A_t})\\ =R_t^{-1} (x_t-B_t u_t) -R_t^{-1} A_t \frac{A_t^T R_t^{-1}x_t-A_t^T R_t^{-1} B_t u_t +\Sigma_{t-1}^{-1} \mu_{t-1}}{\Sigma_{t-1}^{-1}+A_t^T R_t^{-1} A_t}\\ =R_t^{-1} (x_t-B_t u_t) -R_t^{-1} A_t \frac{A_t^T R_t^{-1}(x_t- B_t u_t) +\Sigma_{t-1}^{-1} \mu_{t-1}}{\Sigma_{t-1}^{-1}+A_t^T R_t^{-1} A_t}\\ =[R_t^{-1} -R_t^{-1} A_t^T \frac{A_t R_t^{-1} }{\Sigma_{t-1}^{-1}+A_t^T R_t^{-1} A_t}](x_t- B_t u_t)- R_t^{-1} A_t\frac{\Sigma_{t-1}^{-1} \mu_{t-1}}{\Sigma_{t-1}^{-1}+A_t^T R_t^{-1} A_t}(求逆定理)\\ =(R_t + A_t \Sigma_{t-1}A_t^T)^{-1}(x_t- B_t u_t)- R_t^{-1} A_t \frac{\Sigma_{t-1}^{-1} \mu_{t-1}}{\Sigma_{t-1}^{-1}+A_t^T R_t^{-1} A_t}\\$

二阶导数：
$\frac{\partial^2 L_t(x_t)}{\partial x_t^2}=(R_t + A_t \Sigma_{t-1}A_t^T)^{-1}$

当一阶导数为零时
$0=(R_t + A_t \Sigma_{t-1}A_t^T)^{-1}(x_t- B_t u_t)- R_t^{-1} A_t \frac{\Sigma_{t-1}^{-1} \mu_{t-1}}{\Sigma_{t-1}^{-1}+A_t^T R_t^{-1} A_t}\\ (R_t + A_t \Sigma_{t-1}A_t^T)^{-1}(x_t- B_t u_t)= R_t^{-1} A_t \frac{\Sigma_{t-1}^{-1} \mu_{t-1}}{\Sigma_{t-1}^{-1}+A_t^T R_t^{-1} A_t}\\ (x_t- B_t u_t)= (R_t + A_t \Sigma_{t-1}A_t^T) R_t^{-1} A_t (\Sigma_{t-1}^{-1}+A_t^T R_t^{-1} A_t )^{-1}\Sigma_{t-1}^{-1} \mu_{t-1}\\ (x_t- B_t u_t)= (R_t + A_t \Sigma_{t-1}A_t^T) R_t^{-1} A_t(I+\Sigma_{t-1} A_t^T R_t^{-1} A_t )^{-1}\mu_{t-1}\\ (x_t- B_t u_t)= ( A_t + A_t \Sigma_{t-1}A_t^T R_t^{-1} A_t) (I+\Sigma_{t-1} A_t^T R_t^{-1} A_t )^{-1}\mu_{t-1}\\ (x_t- B_t u_t)= A_t ( I + \Sigma_{t-1}A_t^T R_t^{-1} A_t) (I+\Sigma_{t-1} A_t^T R_t^{-1} A_t )^{-1}\mu_{t-1}\\ (x_t- B_t u_t)= A_t \mu_{t-1}\\ x_t= A_t \mu_{t-1} + B_t u_t\\$

后验

根据贝叶斯滤波器的后验公式
$\operatorname{bel}\left(x_{t}\right)=\eta \underbrace{p\left(z_{t} | x_{t}\right)}_{\sim \mathcal{N}\left(z_{t}: C_{t} x_{t}, Q_{t}\right)} \underbrace{\overline{\operatorname{bel}}\left(x_{t}\right)}_{\sim \mathcal{N}\left(x_{t}: \bar{\mu}_{t}, \bar{\Sigma}_{t}\right)}$

简化表示为 $bel(x_t)=\eta exp\{-J_t\}$ ,其中
$J_t=\frac{1}{2}(z_t-C_tx_t)^TQ^{-1}(z_t-C_tx_t) + \frac{1}{2}(x_t-\overline{\mu}_t)^T\overline{\Sigma}_t^{-1}(x_t-\overline{\mu}_t)$

由于依旧是 $x_t$ 的二次型，即满足高斯分布，同样可以采用求一阶导数和二阶导数的方法求均值和方差。

一阶导数：
$\frac{\partial J}{\partial x_t} = -C_t^T Q_t^{-1}(z_t-C_tx_t) + \overline{\Sigma}_t^{-1}(x_t-\overline{\mu}_t)$

二阶导数：

$\frac{\partial^2 J}{\partial x_t^2} = C_t^T Q_t^{-1}C_t+ \overline{\Sigma}_t^{-1}$

因此， $\Sigma_t = (C_t^T Q_t^{-1}C_t+ \overline{\Sigma}_t^{-1})^{-1}$

令一阶导数为零
$-C_t^T Q_t^{-1}(z_t-C_tx_t) + \overline{\Sigma}_t^{-1}(x_t-\overline{\mu}_t)\\ C_t^T Q_t^{-1}(z_t-C_tx_t) = \overline{\Sigma}_t^{-1}(x_t-\overline{\mu}_t)\\ C_t^T Q_t^{-1}z_t-C_t^T Q_t^{-1} C_tx_t = \overline{\Sigma}_t^{-1}x_t-\overline{\Sigma}_t^{-1} \overline{\mu}_t\\ (C_t^T Q_t^{-1} C_t + \overline{\Sigma}_t^{-1})x_t = C_t^T Q_t^{-1}z_t + \overline{\Sigma}_t^{-1} \overline{\mu}_t\\ x_t = (C_t^T Q_t^{-1} C_t + \overline{\Sigma}_t^{-1})^{-1}C_t^T Q_t^{-1}z_t + (C_t^T Q_t^{-1} C_t + \overline{\Sigma}_t^{-1})^{-1} \overline{\Sigma}_t^{-1} \overline{\mu}_t\\$
令 $x_t = \overline{\mu}_t +K_k(z_t-C_t\overline{\mu}_t)$ ,整理得
$K_k = C_t^T Q_t^{-1}(C_t^T Q_t^{-1} C_t + \overline{\Sigma}_t^{-1})^{-1}$
最后将 $\Sigma_t$ 也用 $K_k$ 来表达，

$\Sigma_t = (C_t^T Q_t^{-1}C_t+ \overline{\Sigma}_t^{-1})^{-1}\\ \Sigma_t = (I - C_t^T Q_t^{-1}(C_t^T Q_t^{-1} C_t + \overline{\Sigma}_t^{-1})^{-1}C_t )\overline{\Sigma}_t\\ \Sigma_t = (I - K_kC_t )\overline{\Sigma}_t\\$
综上，卡尔曼滤波器的五个公式便推导完毕了。