扩展卡尔曼滤波

Shilong Wang

已于 2022-12-07 14:30:37 修改

阅读量372

点赞数

分类专栏： SLAM 文章标签：算法人工智能计算机视觉

于 2022-10-15 20:15:50 首次发布

本文链接：https://blog.csdn.net/wsl_longwudi/article/details/127298707

版权

SLAM 专栏收录该内容

30 篇文章 4 订阅

订阅专栏

扩展卡尔曼滤波就是贝叶斯滤波添加一些近似的实际应用：将置信度和噪声限制为高斯分布，并且对运动和观测模型进行线性化计算贝叶斯滤波中的积分(以及归一化积) 。
假设 $\boldsymbol{x}_{k}$ 的概率密度函数限制为高斯分布：
$p\left( \boldsymbol{x}_{k}\vert \check{\boldsymbol{x}}_{0},\boldsymbol{u}_{1:k},\boldsymbol{y}_{0:k}\right)=\mathcal{N}\left(\hat{\boldsymbol{x}}_k,\hat{\boldsymbol{P}}_k\right)$
其中 $\hat{\boldsymbol{x}}_{k}$ 为均值， $\hat{\boldsymbol{P}}_k$ 为协方差。接下来我们假设噪声变量 $\boldsymbol{w}_k$ 和 $\boldsymbol{n}_k$ 也是高斯的：
$\begin{aligned} \boldsymbol{w}_k&\sim\mathcal{N}(\bf{0},\boldsymbol{Q}_k) \\ \boldsymbol{n}_k&\sim\mathcal{N}(\bf{0},\boldsymbol{R}_k) \end{aligned}$
高斯PDF通过非线性函数转换后，可能会成为非高斯的。

运动模型线性化：

$\begin{aligned} \boldsymbol{x}_{k}=f\left( \boldsymbol{x}_{k-1},\boldsymbol{u}_{k},\boldsymbol{w}_{k}\right) \approx \check{\boldsymbol{x}}_{k}+\boldsymbol{F}_{k-1}\left( \boldsymbol{x}_{k-1}-\hat{\boldsymbol{x}}_{k-1} \right) +\boldsymbol{w}_{k}' \end{aligned}$
其中
$\begin{aligned} \check{\boldsymbol{x}}_{k} &= f\left( \hat{\boldsymbol{x}}_{k-1},\boldsymbol{u}_{k},\bf{0}\right) \\ \boldsymbol{F}_{k-1} &= \left. \dfrac{\partial f\left( \boldsymbol{x}_{k-1},\boldsymbol{u}_{k},\omega _{k}\right) }{\partial \boldsymbol{x}_{k-1}}\right \rvert _{\hat{\boldsymbol{x}}_{k-1},\boldsymbol{u}_{k},\bf{0}}\\ \boldsymbol{w}_{k}' &= \left. \dfrac{\partial f\left( \boldsymbol{x}_{k-1},\boldsymbol{u}_{k},\boldsymbol{w}_{k}\right) }{\partial \boldsymbol{w}_{k}}\right\rvert _{\hat{\boldsymbol{x}}_{k-1},\boldsymbol{u}_{k},\bf{0}} \boldsymbol{w}_{k}=\boldsymbol{L}_k\boldsymbol{w}_k \end{aligned}\tag{state predict}$
给定过去的状态和最新输入，则当前状态 $\boldsymbol{x}_k$ 的统计学特性为：
$\begin{aligned} &E\left( \boldsymbol{x}_{k}\right) \approx \check{\boldsymbol{x}}_{k}+\boldsymbol{F}_{k-1}\underbrace{E( \boldsymbol{x}_{k-1}-\hat{\boldsymbol{x}}_{k-1})}_{E(\boldsymbol{x_{k-1}})-\hat{\boldsymbol{x}}_{k-1}=\bf{0}} +\underbrace{E\left( \boldsymbol{w}_{k}'\right) }_{\bf{0}}\\ &E\left[ \left( \boldsymbol{x}_{k}-E\left( \boldsymbol{x}_{k}\right) \right) \left( \boldsymbol{x}_{k}-E\left( \boldsymbol{x}_{k}\right) \right) ^{T}\right] \approx \underbrace{E\left[ \boldsymbol{w} _{k}'\boldsymbol{w}_{k}'^{T}\right]}_{\boldsymbol{Q}'_{k}}\\ &p\left( \boldsymbol{x}_{k}\vert \boldsymbol{x}_{k-1},\boldsymbol{u}_{k}\right) \approx \mathcal{N}\left( \check{\boldsymbol{x}}_{k}+\boldsymbol{F}_{k-1}\left( \boldsymbol{x}_{k-1}-\hat{\boldsymbol{x}}_{k-1}\right) ,\boldsymbol{Q}'_{k}\right) \end{aligned}$

观测模型线性化：

$\begin{aligned} \boldsymbol{y}_{k}=\boldsymbol{h}\left( \boldsymbol{x}_{k},\boldsymbol{n}_{k}\right) =\check{\boldsymbol{y}}_{k}+\boldsymbol{H}_{k}\left( \boldsymbol{x}_{k}-\check{\boldsymbol{x}}_{k}\right) +\boldsymbol{n}_{k}' \end{aligned}$
其中
$\begin{aligned} \check{\boldsymbol{y}}_{k}&=\boldsymbol{h}\left( \check{\boldsymbol{x}}_{k},\bf{0}\right) \\ \boldsymbol{H}_{k} &= \left.\dfrac{\partial \boldsymbol{h}\left( \boldsymbol{x}_{k},\boldsymbol{n}_{k}\right) }{\partial \boldsymbol{x}_{k}}\right\vert _{\check{\boldsymbol{x}}_{k},\bf{0}}\\ \boldsymbol{n}_{k}' &= \left.\dfrac{\partial \boldsymbol{h}\left( \boldsymbol{x}_{k},\boldsymbol{n}_{k}\right) }{\partial \boldsymbol{n}_{k}}\right\vert _{\check{\boldsymbol{x}}_{k},\bf{0}}\boldsymbol{n}_{k} \end{aligned}$
给定当前状态，则当前状态观测 $\boldsymbol{y}_k$ 的统计学特性为：
$\begin{aligned} E\left( \boldsymbol{y}_{k}\right) \approx \check{\boldsymbol{y}}_{k}+\boldsymbol{H}_{k}\left( \boldsymbol{x}_{k}-\check{\boldsymbol{x}}_{k}\right) +\underbrace{E\left( \boldsymbol{n}_{k}'\right) }_{0}\\ E\left[\left( \boldsymbol{y}_{k}-E\left( \boldsymbol{y}_{k}\right) \right) \left( \boldsymbol{y}_{k}-E\left( \boldsymbol{y}_{k}\right) \right) ^{T}\right]\approx \underbrace{E\left[ \boldsymbol{n}'_{k}{\boldsymbol{n}'}_{k}^T\right] }_{\boldsymbol{R}_{k}'}\\ p\left( \boldsymbol{y}_{k}\vert \boldsymbol{x}_{k}\right) \approx \mathcal{N}\left( \check{\boldsymbol{y}}_{k}+\boldsymbol{H}_{k}\left( \boldsymbol{x}_{k}-\check{\boldsymbol{x}}_{k}\right) ,\boldsymbol{R}_{k}'\right) \end{aligned}$

代入贝叶斯滤波框架

由贝叶斯滤波，可知：
$\begin{aligned} \overbrace{p\left( \boldsymbol{x}_{k}| \check{\boldsymbol{x}}_{0},\boldsymbol{u}_{1:k},\boldsymbol{y}_{0:k}\right)}^{k时刻状态估计后验概率} &=\eta \overbrace{p\left( \boldsymbol{y}_{k}| \boldsymbol{x}_{k}\right)}^{k时刻观测模型} \overbrace{p\left( \boldsymbol{x}_{k}| \check{\boldsymbol{x}}_{0},\boldsymbol{u}_{1:k},\boldsymbol{y}_{0:k-1}\right)}^{k时刻状态估计先验概率}\\ \underbrace{p\left( \boldsymbol{x}_{k}\vert \check{\boldsymbol{x}}_{0},\boldsymbol{u}_{1:k},\boldsymbol{y}_{0:k}\right)}_{\mathcal{N}\left( \hat{\boldsymbol{x}}_{k},\hat{\boldsymbol{P}}_{k}\right)} &=\overbrace{\eta \underbrace{p\left( \boldsymbol{y}_{k}\vert \boldsymbol{x}_{k}\right)}_{\mathcal{N}\left( \boldsymbol{y}_{k}+\boldsymbol{H}_k\left( \boldsymbol{x}_{k}-\check{\boldsymbol{x}}_{k}\right) ,\boldsymbol{R}'_k\right)} \times \overbrace{\int \underbrace{p\left( \boldsymbol{x}_{k}\vert \boldsymbol{x}_{k-1},\boldsymbol{u}_{k}\right)}_{\mathcal{N}\left( \check{\boldsymbol{x}}_{k}+\boldsymbol{F}_{k-1}\left( \boldsymbol{x}_{k-1}-\hat{\boldsymbol{x}}_{k-1}\right) ,\boldsymbol{Q}_{k}'\right)} \underbrace{p\left( \boldsymbol{x}_{k-1}\vert \check{\boldsymbol{x}}_{0},\boldsymbol{u}_{1:k-1},\boldsymbol{y}_{0:k-1}\right)}_{\mathcal{N}\left( \hat{\boldsymbol{x}}_{k-1},\hat{\boldsymbol{P}}_{k-1}\right) } {\rm d}\boldsymbol{x}_{k-1}}^{预测步}}^{更新步} \end{aligned}$

由高斯分布的非线性变换可知：
$\begin{aligned} \underbrace{p\left( \boldsymbol{\boldsymbol{y}}\right)}_{\mathcal{N}(\boldsymbol{\mu}_y,\boldsymbol{R}+\boldsymbol{G}\boldsymbol{\Sigma}_{xx}\boldsymbol{G}^T)} &=\int_{-\infty }^{+\infty }\underbrace{p\left( \boldsymbol{\boldsymbol{y}}| \boldsymbol{\boldsymbol{x}}\right)}_{\mathcal{N}(\boldsymbol{\mu} _{y}+\boldsymbol{G}\left( \boldsymbol{x}-\boldsymbol{\mu} _x\right),\boldsymbol{R})}\ \ \underbrace{p\left( \boldsymbol{\boldsymbol{x}}\right)}_{\mathcal{N}(\boldsymbol{\mu}_x,\boldsymbol{\Sigma}_{xx})} {\rm d}\boldsymbol{\boldsymbol{x}} \end{aligned}$
令
$\begin{aligned} \boldsymbol{x} \to \boldsymbol{x}_{k-1} &\quad \boldsymbol{y}\to \boldsymbol{x}_k\\ \boldsymbol{\mu}_x\to\hat{\boldsymbol{x}}_{k-1} &\quad \boldsymbol{\mu}_y \to \check{\boldsymbol{x}}_k\\ \boldsymbol{G} \to \boldsymbol{F}_{k-1} &\quad \boldsymbol{R} \to \boldsymbol{Q}'_k\\ \boldsymbol{\Sigma}_{xx} \to \hat{\boldsymbol{P}}_{k-1}&\quad \boldsymbol{\Sigma}_{yy}\to\hat{\boldsymbol{P}}_k \end{aligned}$
于是可以得到积分号内两个高斯分布的积分结果(即预测步得到的第k步先验估计)
$\underbrace{ p\left(\boldsymbol{x}_{k}| \check{\boldsymbol{x}}_{0},\boldsymbol{u}_{1:k},\boldsymbol{y}_{0:k-1}\right)}_{\boldsymbol{x}_k\sim\mathcal{N}(\check{\boldsymbol{x}}_k,\boldsymbol{Q}'_k+\boldsymbol{F}_{k-1}\hat{\boldsymbol{P}}_{k-1} \boldsymbol{F}_{k-1}^T)} = \int \underbrace{p\left( \boldsymbol{x}_{k}\vert \boldsymbol{x}_{k-1},\boldsymbol{u}_{k}\right)}_{\mathcal{N}\left( \check{\boldsymbol{x}}_{k}+\boldsymbol{F}_{k-1}\left( \boldsymbol{x}_{k-1}-\hat{\boldsymbol{x}}_{k-1}\right) ,\boldsymbol{Q}_{k}'\right)} \underbrace{p\left( \boldsymbol{x}_{k-1}\vert \check{\boldsymbol{x}}_{0},\boldsymbol{u}_{1:k-1},\boldsymbol{y}_{0:k-1}\right)}_{\mathcal{N}\left( \hat{\boldsymbol{x}}_{k-1},\hat{\boldsymbol{P}}_{k-1}\right) } {\rm d}\boldsymbol{x}_{k-1}$
$\underbrace{p\left( \boldsymbol{x}_{k}\vert \check{\boldsymbol{x}}_{0},\boldsymbol{u}_{1:k},\boldsymbol{y}_{0:k}\right)}_{\boldsymbol{x}_k\sim\mathcal{N}\left( \hat{\boldsymbol{x}}_{k},\hat{\boldsymbol{P}}_{k}\right)} =\eta \underbrace{p\left( \boldsymbol{y}_{k}\vert \boldsymbol{x}_{k}\right)}_{\boldsymbol{y}_k\sim\mathcal{N}\left( \check{\boldsymbol{y}}_{k}+\boldsymbol{H}_k\left( \boldsymbol{x}_{k}-\check{\boldsymbol{x}}_{k}\right) ,\boldsymbol{R}'_k\right)} \times \underbrace{ p\left(\boldsymbol{x}_{k}| \check{\boldsymbol{x}}_{0},\boldsymbol{u}_{1:k},\boldsymbol{y}_{0:k-1}\right)}_{\boldsymbol{x}_k\sim\mathcal{N}(\check{\boldsymbol{x}}_k,\boldsymbol{Q}'_k+\boldsymbol{F}_{k-1}\hat{\boldsymbol{P}}_{k-1} \boldsymbol{F}_{k-1}^T)}$
先验协方差矩阵
$\begin{aligned} \check{\boldsymbol{P}}_{k}=\boldsymbol{Q}_{k}'+\boldsymbol{F}_{k-1}\hat{\boldsymbol{P}}_{k}\boldsymbol{F}_{k-1}^{T} \end{aligned}\tag{cov predict}$

将 $p\left( \boldsymbol{y}_{k}\vert \boldsymbol{x}_{k}\right)$ 看做以 $\boldsymbol{x}_k$ 为变量的函数：
$\begin{aligned} p\left( \boldsymbol{y}_{k}\vert \boldsymbol{x}_{k}\right)&=\rho\exp\left(\left(\boldsymbol{y}_k-\left( \check{\boldsymbol{y}}_{k}+\boldsymbol{H}_k\left( \boldsymbol{x}_{k}-\check{\boldsymbol{x}}_{k}\right)\right)\right)^T {\boldsymbol{R}'}_k^{-1} \left(\boldsymbol{y}_k-\left( \check{\boldsymbol{y}}_{k}+\boldsymbol{H}_k\left( \boldsymbol{x}_{k}-\check{\boldsymbol{x}}_{k}\right)\right)\right)\right)\\ &=\rho\exp\left(\left(\boldsymbol{H}_k \boldsymbol{x}_{k}-\left(\boldsymbol{H}_k\check{\boldsymbol{x}}_{k}+(\boldsymbol{y}_k-\check{\boldsymbol{y}}_{k})\right)\right)^T {\boldsymbol{R}'}_k^{-1} \left(\boldsymbol{H}_k \boldsymbol{x}_{k}-\left(\boldsymbol{H}_k\check{\boldsymbol{x}}_{k}+(\boldsymbol{y}_k-\check{\boldsymbol{y}}_{k})\right)\right)\right)\\ &=\rho\exp\left(\left(\boldsymbol{x}_{k}-\left(\check{\boldsymbol{x}}_{k}+ \boldsymbol{H}_k^{-1} (\boldsymbol{y}_k-\check{\boldsymbol{y}}_{k})\right)\right)^T\boldsymbol{H}_k ^T {\boldsymbol{R}'}_k^{-1} \boldsymbol{H}_k\left(\boldsymbol{x}_{k}-\left(\check{\boldsymbol{x}}_{k}+ \boldsymbol{H}_k^{-1} (\boldsymbol{y}_k-\check{\boldsymbol{y}}_{k})\right)\right)\right) \end{aligned}$
如果 $\boldsymbol{H}_k$ 可逆，则可以进行如下转换：
$\underbrace{p\left( \boldsymbol{x}_{k}\vert \check{\boldsymbol{x}}_{0},\boldsymbol{u}_{1:k},\boldsymbol{y}_{0:k}\right)}_{\boldsymbol{x}_k\sim\mathcal{N}\left( \hat{\boldsymbol{x}}_{k},\hat{\boldsymbol{P}}_{k}\right)} =\eta \underbrace{p\left( \boldsymbol{y}_{k}\vert \boldsymbol{x}_{k}\right)}_{\boldsymbol{x}_k\sim\mathcal{N}\left( \check{\boldsymbol{x}}_{k}+\boldsymbol{H}_k^{-1}\left( \boldsymbol{y}_{k}-\check{\boldsymbol{y}}_{k}\right) ,\left(\boldsymbol{H}_k^T {\boldsymbol{R}'}_k^{-1} \boldsymbol{H}_k\right)^{-1}\right)} \times \underbrace{ p\left(\boldsymbol{x}_{k}| \check{\boldsymbol{x}}_{0},\boldsymbol{u}_{1:k},\boldsymbol{y}_{0:k-1}\right)}_{\boldsymbol{x}_k\sim\mathcal{N}(\check{\boldsymbol{x}}_k,\boldsymbol{Q}'_k+\boldsymbol{F}_{k-1}\hat{\boldsymbol{P}}_{k-1} \boldsymbol{F}_{k-1}^T)}$
但是 $\boldsymbol{H}_k$ 可能不可逆，更严谨的做法是根据高斯分布随机变量线性变换的归一化积公式，得

$\begin{aligned} \hat{\boldsymbol{P}}_{k}^{-1} &= \check{\boldsymbol{P}}_k^{-1}+\boldsymbol{H}_k^T {\boldsymbol{R}'}_k^{-1} \boldsymbol{H}_k &(1) \\ \hat{\boldsymbol{P}}_{k}^{-1}\hat{\boldsymbol{x}}_{k} &=\check{\boldsymbol{P}}_k^{-1}\check{\boldsymbol{x}}_k+ \boldsymbol{H}_k^T {\boldsymbol{R}'}_k^{-1} \left( \boldsymbol{H}_k\check{\boldsymbol{x}}_{k}+\left( \boldsymbol{y}_{k}-\check{\boldsymbol{y}}_{k}\right)\right) &(2) \end{aligned}$
由矩阵求逆定理的(2)式 $\left(\boldsymbol{D}+\boldsymbol{C}\boldsymbol{A}\boldsymbol{B}\right) ^{-1} \equiv \boldsymbol{D}^{-1}-\boldsymbol{D}^{-1}\boldsymbol{C}\left( \boldsymbol{A}^{-1}+\boldsymbol{B}\boldsymbol{D}^{-1}\boldsymbol{C}\right) ^{-1}\boldsymbol{B}\boldsymbol{D}^{-1}$
$\begin{aligned} \begin{aligned} \hat{\boldsymbol{P}}_{k} &=\left(\check{\boldsymbol{P}}_k^{-1}+\boldsymbol{H}_k^T {\boldsymbol{R}'}_k^{-1} \boldsymbol{H}_k\right)^{-1} \\ &= \check{\boldsymbol{P}}_{k}-\check{\boldsymbol{P}}_{k}\boldsymbol{H} _{k}^{T}\left( \boldsymbol{R}_{k}'+\boldsymbol{H}_{k}\check{\boldsymbol{P}}_{k}\boldsymbol{H}_{k}^{T}\right) ^{-1}\boldsymbol{H}_{k}\check{\boldsymbol{P}}_{k}\\ &=\left( \bf{I}-\check{\boldsymbol{P}}_{k}\boldsymbol{H}_{k}^{T}\left( {\boldsymbol{R}'}_{k}+\boldsymbol{H}_{k}\check{\boldsymbol{P}}_{k}\boldsymbol{H}_{k}^{T}\right) ^{-1}\boldsymbol{H}_{k}\right) \check{\boldsymbol{P}}_{k} \end{aligned} \end{aligned}$
归一化积(1)式代入(2)式化简得
$\begin{aligned} \bf{I} &= \hat{\boldsymbol{P}}_{k}\left(\check{\boldsymbol{P}}_k^{-1}+\boldsymbol{H}_k^T {\boldsymbol{R}'}_k^{-1} \boldsymbol{H}_k\right)\\ \hat{\boldsymbol{x}}_{k}&=\hat{\boldsymbol{P}}_{k}\left(\check{\boldsymbol{P}}_{k}^{-1}+ \boldsymbol{H}_{k}^{T} {\boldsymbol{R}'}_{k}^{-1}\boldsymbol{H}_{k}\right) \check{\boldsymbol{x}}_{k}+\hat{\boldsymbol{P}}_{k}\boldsymbol{H}_{k}^{T}{\boldsymbol{R}'}_{k}^{-1}\left( \boldsymbol{y}_{k}-\check{\boldsymbol{y}}_{k}\right)\\ &=\check{\boldsymbol{x}}_{k}+\hat{\boldsymbol{P}}_{k}\boldsymbol{H}_{k}^{T}{\boldsymbol{R}'}_{k}^{-1}\left( \boldsymbol{y}_{k}-\check{\boldsymbol{y}}_{k}\right)\\ &=\check{\boldsymbol{x}}_{k}+\left(\check{\boldsymbol{P}}_k^{-1}+\boldsymbol{H}_k^T {\boldsymbol{R}'}_k^{-1} \boldsymbol{H}_k\right)^{-1}\boldsymbol{H}_{k}^{T}{\boldsymbol{R}'}_{k}^{-1}\left( \boldsymbol{y}_{k}-\check{\boldsymbol{y}}_{k}\right) \end{aligned}$
由矩阵求逆定理的(4)式 $\left( \boldsymbol{D}+\boldsymbol{C}\boldsymbol{A}\boldsymbol{B}\right)^{-1}\boldsymbol{C}\boldsymbol{A} \equiv \boldsymbol{D}^{-1}\boldsymbol{C}\left( \boldsymbol{A}^{-1}+\boldsymbol{B}\boldsymbol{D}^{-1}\boldsymbol{C}\right) ^{-1}$
$\left(\check{\boldsymbol{P}}_k^{-1} + \boldsymbol{H}_k^T {\boldsymbol{R}'}_k^{-1} \boldsymbol{H}_k\right)^{-1}\boldsymbol{H}_{k}^{T}{\boldsymbol{R}'}_{k}^{-1}=\check{\boldsymbol{P}}_{k}\boldsymbol{H}_k^{T}\left( \boldsymbol{R}_{k}'+\boldsymbol{H}_{k}\check{\boldsymbol{P}}_{k}\boldsymbol{H}_{k}^{T}\right) ^{-1}$
结合前面的预测方程(state predict)和(cov predict)

设卡尔曼增益为
$\begin{aligned} \boldsymbol{K}_k=\check{\boldsymbol{P}}_{k}\boldsymbol{H}_k^{T}\left( \boldsymbol{R}_{k}'+\boldsymbol{H}_{k}\check{\boldsymbol{P}}_{k}\boldsymbol{H}_{k}^{T}\right) ^{-1} \end{aligned}$
则更新步：
$\begin{aligned} \hat{\boldsymbol{P}}_{k} &=\left( \bf{I}-\boldsymbol{K}_k \boldsymbol{H}_{k} \right) \underbrace{\check{\boldsymbol{P}}_{k}}_{\boldsymbol{Q}_{k}'+\boldsymbol{F}_{k-1}\hat{\boldsymbol{P}}_{k}\boldsymbol{F}_{k-1}^{T}}\\ \hat{\boldsymbol{x}}_k &=\underbrace{\check{\boldsymbol{x}}_{k}}_{\boldsymbol{f}\left( \hat{\boldsymbol{x}}_{k-1},\boldsymbol{u}_{k},\bf{0}\right)}+\boldsymbol{K}_k( \boldsymbol{y}_{k}-\underbrace{\check{\boldsymbol{y}}_{k}}_{\boldsymbol{h}\left( \check{\boldsymbol{x}}_{k},\bf{0}\right)})\\ \end{aligned}$

通过非线性的运动和观测模型来传递估计的均值
噪声协方差 $\boldsymbol{Q}'_k$ 和 $\boldsymbol{R}'_k$ 中包含了雅可比矩阵，这是因为我们允许噪声应用于非线性模型中。

EKF并不能保证在一般的非线性系统中能够充分的发挥作用。EKF的主要问题在于，其线性化的工作点是估计状态的均值，而不是真实状态。

广义高斯滤波

一般来说，我们先从 $k - 1$ 时刻的高斯后验开始：
${p\left( \boldsymbol{x}_{k-1}\vert \check{\boldsymbol{x}}_{0},\boldsymbol{u}_{1:k-1},\boldsymbol{y}_{0:k-1}\right)}={\mathcal{N}\left( \hat{\boldsymbol{x}}_{k-1},\hat{\boldsymbol{P}}_{k-1}\right)}$

通过非线性运动模型 $\boldsymbol{f}(\cdot)$ 在时间上向前递推，以得到在 $k$ 时刻的高斯先验：
${p\left( \boldsymbol{x}_{k}\vert \check{\boldsymbol{x}}_{0},\boldsymbol{u}_{1:k},\boldsymbol{y}_{0:k-1}\right)}={\mathcal{N}\left( \check{\boldsymbol{x}}_{k},\check{\boldsymbol{P}}_{k}\right)}$
这是预测步骤，结合了最新的输入 $\boldsymbol{u}_k$ 。

对于校正步骤，我们采用联合高斯概率密度函数，分解与推断的方法，写出 $k$ 时刻状态和最新测量的联合高斯分布：
$\begin{aligned} {p\left( \boldsymbol{x}_{k},\boldsymbol{y}_{k}\vert \check{\boldsymbol{x}}_{0},\boldsymbol{u}_{1:k},\boldsymbol{y}_{0:k-1}\right)} =\mathcal{N}\left( \begin{bmatrix} \boldsymbol{\mu }_{x,k} \\ \boldsymbol{\mu }_{y,k} \end{bmatrix},\begin{bmatrix} \boldsymbol{\Sigma}_{xx,k} & \boldsymbol{\Sigma}_{xy,k} \\ \boldsymbol{\Sigma}_{yx,k} & \boldsymbol{\Sigma}_{yy,k} \end{bmatrix}\right) \end{aligned}$

则 $\boldsymbol{x}_k$ 的条件概率密度函数：
$\begin{aligned} {p\left( \boldsymbol{x}_{k}\vert \check{\boldsymbol{x}}_{0},\boldsymbol{u}_{1:k},\boldsymbol{y}_{0:k}\right)} = \mathcal{N}( \underbrace{\boldsymbol{\mu} _{x,k}+\boldsymbol{\Sigma} _{xy,k}\boldsymbol{\Sigma} _{yy,k}^{-1}\left( \boldsymbol{y}_k-\boldsymbol{\mu}_{y,k}\right)}_{\hat{\boldsymbol{x}}_k} , \underbrace{\boldsymbol{\Sigma}_{xx,k}-\boldsymbol{\Sigma}_{xy,k}\boldsymbol{\Sigma}_{yy,k}^{-1}\boldsymbol{\Sigma}_{yx,k}}_{\hat{\boldsymbol{P}_k}}) \end{aligned}$
将 $\hat{\boldsymbol{x}}_k$ 定义为均值， $\hat{\boldsymbol{P}}_k$ 定义为协方差，可以写出广义高斯滤波中校正步骤的方程：
$\begin{aligned} \boldsymbol{K}_k&=\boldsymbol{\Sigma}_{xy,k}\boldsymbol{\Sigma}_{yy,k}^{-1}\\ \hat{\boldsymbol{P}}_k&=\check{\boldsymbol{P}}_k-\boldsymbol{K}_k\boldsymbol{\Sigma}_{xy,k}^T\\ \hat{\boldsymbol{x}}_k&=\check{\boldsymbol{x}}_k+\boldsymbol{K}_k\left(\boldsymbol{y}_k-\boldsymbol{\mu}_{y,k}\right)\tag{GGF update} \end{aligned}$

其中
$\begin{aligned} \boldsymbol{\mu}_{x,k}&= E(\boldsymbol{x}_k\vert \check{\boldsymbol{x}}_{0},\boldsymbol{u}_{1:k},\boldsymbol{y}_{0:k-1})=\check{\boldsymbol{x}}_{k}\\ \boldsymbol{\Sigma}_{xx,k}&=E\left((\boldsymbol{x}_k-\boldsymbol{\mu}_{x,k})(\boldsymbol{x}_k-\boldsymbol{\mu}_{x,k})^T{\Large\vert} \check{\boldsymbol{x}}_{0},\boldsymbol{u}_{1:k},\boldsymbol{y}_{0:k-1}\right)=\check{\boldsymbol{P}}_{k} \end{aligned}$

对非线性观测模型在任意一点 $\boldsymbol{x}_{op,k}$ 进行线性化，可得：
$\begin{aligned} \boldsymbol{y}_{k}=\boldsymbol{h}\left( \boldsymbol{x}_{k},\boldsymbol{n}_{k}\right) =\boldsymbol{y}_{op,k}+\boldsymbol{H}_{k}\left( \boldsymbol{x}_{k}-\boldsymbol{x}_{op,k}\right) +\boldsymbol{n}_{k}' \end{aligned}$
其中
$\begin{aligned} \boldsymbol{y}_{op,k}&=\boldsymbol{h}\left( \boldsymbol{x}_{op,k},\bf{0}\right) \\ \boldsymbol{H}_{k} &= \left.\dfrac{\partial \boldsymbol{h}\left( \boldsymbol{x}_{k},\boldsymbol{n}_{k}\right) }{\partial \boldsymbol{x}_{k}}\right\vert _{\boldsymbol{x}_{op,k},\bf{0}}\\ \boldsymbol{n}_{k}' &= \left.\dfrac{\partial \boldsymbol{h}\left( \boldsymbol{x}_{k},\boldsymbol{n}_{k}\right) }{\partial \boldsymbol{n}_{k}}\right\vert _{\boldsymbol{x}_{op,k},\bf{0}}\boldsymbol{n}_{k} \end{aligned}$
则
$\begin{aligned} &\begin{aligned} \boldsymbol{\mu}_{y,k}&=E(\boldsymbol{y}_{k}\vert \check{\boldsymbol{x}}_{0},\boldsymbol{u}_{1:k},\boldsymbol{y}_{0:k-1}) \\ &= \underbrace{E\left(\boldsymbol{y}_{op,k}-\boldsymbol{H}_{k}\boldsymbol{x}_{op,k}\vert \check{\boldsymbol{x}}_{0},\boldsymbol{u}_{1:k},\boldsymbol{y}_{0:k-1}\right)}_{\rm Constant}+\underbrace{E\left(\boldsymbol{H}_{k} \boldsymbol{x}_{k}\vert \check{\boldsymbol{x}}_{0},\boldsymbol{u}_{1:k},\boldsymbol{y}_{0:k-1}\right)}_{\boldsymbol{H}_{k}E\left( \boldsymbol{x}_{k}\vert \check{\boldsymbol{x}}_{0},\boldsymbol{u}_{1:k},\boldsymbol{y}_{0:k-1}\right)}+\underbrace{E\left(\boldsymbol{n}_{k}'\right)}_{\bf{0}}\\ &= \boldsymbol{y}_{op,k}-\boldsymbol{H}_{k}\boldsymbol{x}_{op,k}+\boldsymbol{H}_{k}\check{\boldsymbol{x}}_k\\ &= \boldsymbol{y}_{op,k}+\boldsymbol{H}_{k}\left(\check{\boldsymbol{x}}_k-\boldsymbol{x}_{op,k}\right) \end{aligned}\\ &\begin{aligned} \boldsymbol{\Sigma}_{yy,k}&=E\left(\left[\boldsymbol{y}_{k}-\boldsymbol{\mu}_{y,k}\right]\cdot\left[\boldsymbol{y}_{k}-\boldsymbol{\mu}_{y,k}\right]^T{\Large \vert} \check{\boldsymbol{x}}_{0},\boldsymbol{u}_{1:k},\boldsymbol{y}_{0:k-1}\right) \\ &=E\left(\underbrace{\boldsymbol{H}_{k}\left( \boldsymbol{x}_{k}-\check{\boldsymbol{x}}_{k}\right) \left( \boldsymbol{x}_{k}-\check{\boldsymbol{x}}_{k}\right) ^{T}\boldsymbol{H}_{k}^{T}}_{\boldsymbol{H}_{k}E\left[\left( \boldsymbol{x}_{k}-\check{\boldsymbol{x}}_{k}\right) \left( \boldsymbol{x}_{k}-\check{\boldsymbol{x}}_{k}\right) ^{T}\right]\boldsymbol{H}_{k}^T}+\underbrace{\boldsymbol{n}_{k}'\boldsymbol{n}_{k}'^{T}}_{E(\boldsymbol{n}_{k}'\boldsymbol{n}_{k}'^{T})}+\underbrace{\boldsymbol{n}_{k}'\left[ \boldsymbol{H}_{k}\left( \boldsymbol{x}_{k}-\check{\boldsymbol{x}}_{k}\right) \right]^{T}}_{E(\boldsymbol{n}_k')E(\cdot)=\bf{0}}+\underbrace{\boldsymbol{H}_{k}\left( \boldsymbol{x}_{k}-\check{\boldsymbol{x}}_{k}\right) \boldsymbol{n}_{k}'}_{E(\cdot)E(\boldsymbol{n}'_k)=\bf{0}}{\Large \vert} \check{\boldsymbol{x}}_{0},\boldsymbol{u}_{1:k},\boldsymbol{y}_{0:k-1}\right)\\ &=\boldsymbol{H}_k\check{\boldsymbol{P}}_k \boldsymbol{H}_k^T+\boldsymbol{R}_k' \end{aligned}\\ &\begin{aligned} \boldsymbol{\Sigma}_{xy}&=E\left[ \left( \boldsymbol{x}_{k}-\boldsymbol{\mu} _{x,k}\right) \left( \boldsymbol{y}_{k}-\boldsymbol{\mu} _{y,k}\right) ^{T}{\Large \vert} \check{\boldsymbol{x}}_{0},\boldsymbol{u}_{1:k},\boldsymbol{y}_{0:k-1}\right] \\ &=E\left[ \left( \boldsymbol{x}_{k}-\boldsymbol{\mu} _{x,k}\right) \left( \boldsymbol{H}_{k}\left( \boldsymbol{x}_{k}-\boldsymbol{\mu} _{x,k}\right) \right)^T {\Large \vert} \check{\boldsymbol{x}}_{0},\boldsymbol{u}_{1:k},\boldsymbol{y}_{0:k-1}\right] \\ &=E\left[ \left( \boldsymbol{x}_{k}-\boldsymbol{\mu} _{x,k}\right) \left( \boldsymbol{x}_{k}-\boldsymbol{\mu} _{x,k}\right) ^{T}{\Large \vert} \check{\boldsymbol{x}}_{0},\boldsymbol{u}_{1:k},\boldsymbol{y}_{0:k-1}\right] \boldsymbol{H}_{k}^{T}\\ &=\check{\boldsymbol{P}}_k\boldsymbol{H}_k^T \end{aligned}\\ &\boldsymbol{\Sigma}_{yx}=\boldsymbol{\Sigma}_{xy}^T=\boldsymbol{H}_{k}\check{\boldsymbol{P}}_k \end{aligned}$

将上面四式 $\Uparrow$ 带入GGF update式得：
$\begin{aligned} \boldsymbol{K}_k&=\check{\boldsymbol{P}}_{k}\boldsymbol{H}_k^{T}\left( \boldsymbol{R}_{k}'+\boldsymbol{H}_{k}\check{\boldsymbol{P}}_{k}\boldsymbol{H}_{k}^{T}\right) ^{-1}\\ \hat{\boldsymbol{P}}_k&=\left(\bf{I}-\boldsymbol{K}_k\boldsymbol{G}_k\right)\check{\boldsymbol{P}}_k\\ \hat{\boldsymbol{x}}_k&=\check{\boldsymbol{x}}_k-\boldsymbol{K}_k\left(\boldsymbol{y}_k-\boldsymbol{y}_{op,k}-\boldsymbol{G}_k\left(\check{x}_k-\boldsymbol{x}_{op,k}\right)\right) \end{aligned}\tag{iterate update}$
上式与扩展卡尔曼滤波的增益和校正方程非常相似，唯一的区别在于线性化的工作点。如果我们将线性化的工作点设置为预测先验的均值，即 $\boldsymbol{x}_{op,k}=\check{\boldsymbol{x}}_k$ ，那么两者完全相同。

如果我们迭代计算iterate update式，并且在每一次迭代中将工作点设置为上一次迭代的后验均值，将得到更好的结果：
$\hat{\boldsymbol{x}}_k\to\boldsymbol{x}_{op,k}$
在第一次迭代中，令 $\boldsymbol{x}_{op,k}=\check{\boldsymbol{x}}_k$ 。在迭代的过程中，若 $\boldsymbol{x}_{op,k}$ 的改变足够小就停止迭代。注意，在卡尔曼增益和后验状态收敛之后，协方差方程只需计算一次。