卡尔曼滤波

最新推荐文章于 2023-05-29 14:18:51 发布

Dongz__

最新推荐文章于 2023-05-29 14:18:51 发布

阅读量179

点赞数 1

分类专栏： Kalman Filter 文章标签：机器学习卡尔曼滤波算法

本文链接：https://blog.csdn.net/qq_25521779/article/details/111499628

版权

Kalman Filter 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

观测之间不会相互独立，但是如果建立了隐状态模型，那么观测之间相互独立。

隐马尔可夫模型（Hidden Markov Model）与卡尔曼滤波的关系？

Dynamic Model

	$p(x_t \vert x_{t-1})$	$p(y_t \vert x_t)$	$p(x_1)$
Discrete State Dynamic Model (HMM)	$A_{x_{t-1}, x_{t}}$	Any	$\pi$
Linear Gaussian Dynamic Model (KF)	$N(Ax_{t-1} + B, Q)$	$N(Hx_{t} + C, R)$
Non-linear Gaussain Dynamic Model (Particle filter)	$f(x_{t-1})$	$g(y_{t})$	$f_{0}(x_1)$

当前状态是什么？即$p(x_t | y_1, y_2, …, y_t)，也叫filtering。

Kalman Filter

卡尔曼滤波的目的，即解决 $p(x_t \vert y_1, y_2, ..., y_t)$ 。
$p(x_t \vert x_{t-1}) = N(Ax_{t-1} + B, Q)$
等效于
$x_t = Ax_{t-1} + B + w, \quad w~N(0, Q)$
同时，
$p(y_t | x_t) = N(Hx_{t} + C, R)$
等效于
$y_t = Hx_t + C + u,\quad u~N(0, R)$
因此，线性高斯模型的参数包括 ${A, B, Q, H, C, R\}$ 。
$\begin{aligned} x_t &= Ax_{t-1} + B + w, \quad w \sim N(0, Q) \\ y_t &= Hx_t + C + u, \quad u \sim N(0, R) \end{aligned}$
同时，线性高斯模型具有以下三个特性：
$Cov(X_{t-1}, w) = 0; \quad Cov(X_t, u) = 0; \quad Cov(w, u) = 0$

例子：
假设某个小车的加速度服从高斯分布， $\ddot{x} = a \sim N(0, \sigma^2)$ ，取小车的速度和加速度作为系统模型的状态，
$X_t = \begin{Bmatrix} x_t \\ \dot{x}_t \end{Bmatrix}$
由速度和加速度关系可以得到如下方程组：
$\begin{aligned} x_t &= x_{t-1} + \dot{x}_{t-1} \Delta t + \frac{1}{2} a (\Delta t)^2 \\ \dot{x}_t &= \dot{x}_{t-1} + a \Delta t \end{aligned}$
可以推出
$\begin{bmatrix} x_t \\ \dot{x}_t \end{bmatrix} = \begin{bmatrix} 1 & \Delta t \\ 0 & 1 \end{bmatrix} \begin{bmatrix} x_{t-1} \\ \dot{x}_{t-1} \end{bmatrix} + \begin{bmatrix} \frac{1}{2} a (\Delta t)^2 \\ a \Delta t \end{bmatrix}$
令
$\begin{bmatrix} 1 & \Delta t \\ 0 & 1 \end{bmatrix}; \quad B = \begin{bmatrix} 0 \\ 0 \end{bmatrix}; \quad W = \begin{bmatrix} \frac{1}{2} a (\Delta t)^2 \\ a \Delta t \end{bmatrix}$
即系统的状态转移矩阵。
可以得到：
$X_t = AX_{t-1} + W$
首先，我们计算 $X_t$ 的期望 $E[X_t]$ ，记为 $\mu$ ：
$E[X_t] = E[AX_{t-1} + W] = AE[X_{t-1}] + E[W] \\ =AX_{t-1} + E\begin{bmatrix} \frac{1}{2} a (\Delta t)^2 \\ a \Delta t \end{bmatrix} = AX_{t-1}$
接着，计算 $X_t$ 的协方差
$E[(X_t - \mu)(X_t - \mu)^T] = E[(AX_{t-1} + W -AX_{t-1})(AX_{t-1} + W -AX_{t-1})^T] \\ =E[WW^T] = E \left[ \begin{bmatrix} \frac{1}{2} a (\Delta t)^2 \\ a \Delta t \end{bmatrix} \begin{bmatrix} \frac{1}{2} a (\Delta t)^2 & a \Delta t \end{bmatrix} \right] \\ =E \begin{bmatrix} \frac{1}{4}a^2\Delta t^4 & \frac{1}{2}a^2\Delta t^3 \\ \frac{1}{2}a^2\Delta t^3 & a^2\Delta t^2 \end{bmatrix} = E[a^2] \begin{bmatrix} \frac{1}{4}\Delta t^4 & \frac{1}{2}\Delta t^3 \\ \frac{1}{2}\Delta t^3 & \Delta t^2 \end{bmatrix}$
因为 $\sim N(0, \sigma^2)$ ，即均值 $u_a = 0$ ，所以 $E[a^2] = E[(a - u_a)^2]$ ，也就是a的方差 $\sigma^2$ 。
由此可得， $X_t$ 的协方差为
$E[(X_t - \mu)(X_t - \mu)^T] = \sigma^2 \begin{bmatrix} \frac{1}{4}\Delta t^4 & \frac{1}{2}\Delta t^3 \\ \frac{1}{2}\Delta t^3 & \Delta t^2 \end{bmatrix}$
上式也就是过程噪声W的协方差矩阵Q。至此，已得到该线性高斯系统的参数 ${A, B, W\}$ 。

考虑到该例子中，所观测到的小车状态仅为小车位置，即 $x_t$ ，易得该线性高斯系统的观测方程：
$y_t= x_t + U \implies y_t = \begin{bmatrix} 1, 0 \end{bmatrix}X_t + U$
令
$\begin{bmatrix} 1, 0 \end{bmatrix}; \quad C = [0];$

推导过程

上节最开始提到了，KF的主要目的就是估计 $p(x_t|y_1, y_2, ..., y_t)$ 。
而
$\begin{aligned} & p(x_t|y_1, y_2, ..., y_t) \propto p(x_t, y_1, y_2, ..., y_t) \\ & =p(y_t | x_t, y_1, y_2, ..., y_{t-1})p(x_t | y_1, y_2, ..., y_{t-1})p(y_1, y_2, ..., y_{t-1}) \\ & \propto p(y_t | x_t) p(x_t | y_1, y_2, ..., y_{t-1}) \end{aligned}$
其中， $p(x_t | y_1, y_2, ..., y_{t-1})$ 被称为预测阶段， $p(x_t|y_1, y_2, ..., y_t)$ 被称为更新阶段。
对于预测阶段来说：
$\begin{aligned} &p(x_t | y_1, y_2, ..., y_{t-1}) = \int_{x_{t-1}} p(x_t, x_{t-1} | y_1, y_2, ..., y_{t-1}) dx_{t-1} \\ & =\int_{x_{t-1}} p(x_t | x_{t-1}, y_1, y_2, ..., y_{t-1})p(x_{t-1} | y_1, y_2, ..., y_{t-1})p(y_1, y_2, ..., y_{t-1}) \\ & \propto \int_{x_{t-1}} p(x_t | x_{t-1}, y_1, y_2, ..., y_{t-1})p(x_{t-1} | y_1, y_2, ..., y_{t-1}) \\ &= \int_{x_{t-1}} p(x_t | x_{t-1}) \Large{p(x_{t-1} | y_1, y_2, ..., y_{t-1}) } \end{aligned}$
上式中 $p(x_{t-1} | y_1, y_2, ..., y_{t-1})$ 即为上一步更新结果，那么就可以通过recursive方式进行计算。
注意，对于预测和更新两个阶段来说，他们的概率都服从正态分布，也就是：
$\begin{aligned} Previous \: update: &\quad p(x_{t-1} | y_1, y_2, ..., y_{t-1}) \sim N(\hat{\mu}_{t-1}, \hat{\Sigma}_{t-1}) \\ Prediction: &\quad p(x_t | y_1, y_2, ..., y_{t-1}) \sim N(\bar{\mu}_t, \bar{\Sigma}_t ) \\ Update: &\quad p(x_t | y_1, y_2, ..., y_{t}) \sim N(\hat{\mu}_t, \hat{\Sigma}_t) \end{aligned}$
上式仅描述了t时刻的状态概率分布，但是如何估计或者修正t时刻的实际状态，需要换另一种形式对上式进行改写。
$\begin{aligned} p(x_{t-1} | y_1, y_2, ..., y_{t-1}) &\sim N(\hat{\mu}_{t-1}, \hat{\Sigma}_{t-1}) \\ x_{t-1} | y_1, y_2, ..., y_{t-1} & = \hat{\mu}_{t-1} + \Delta x_{t-1}, \: \Delta x_{t-1} \sim N(0, \hat{\Sigma}_{t-1}) \\ &= E[x_{t-1}] + \Delta x_{t-1}\\ \end{aligned}$
$\begin{aligned} p(x_t | y_1, y_2, ..., y_{t-1}) &\sim N(\bar{\mu}_t, \bar{\Sigma}_t ) \\ x_t | y_1, y_2, ..., y_{t-1} & = \bar{\mu}_t + \Delta x_{t}, \: \Delta x_{t} \sim N(0, \bar{\Sigma}_t ) \\ & = E[x_t] + \Delta x_{t} \\ x_t | y_1, y_2, ..., y_{t-1} & = Ax_{t-1} + w \\ & = A(E[x_{t-1}] + \Delta x_{t-1}) + w \\ & = AE[x_{t-1}] + A \Delta x_{t-1} + w \\ p(x_t | y_1, y_2, ..., y_{t-1}) &= N(AE[x_{t-1}], E[(\Delta x_{t})(\Delta x_{t})^T]) \end{aligned}$
由于 $E[x_t] = AE[x_{t-1}]$ ，所以可知 $\Delta x_t = A \Delta x_{t-1} + w$ 。
$\begin{aligned} y_t | y_1, y_2, ..., y_{t-1} & = Hx_t + v \\ & = H( AE[x_{t-1}] + A \Delta x_{t-1} + w) + v \\ & = HAE[x_{t-1}] + HA \Delta x_{t-1} + Hw + v \\ & = E[y_t] + \Delta y_t \\ p(y_t | y_1, y_2, ..., y_{t-1}) &= N(HAE[x_{t-1}], E[(\Delta y_{t})(\Delta y_{t})^T]) \end{aligned}$

Dongz__

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
卡尔曼滤波

观测之间不会相互独立，但是如果建立了隐状态模型，那么观测之间相互独立。隐马尔可夫模型（Hidden Markov Model）与卡尔曼滤波的关系？Dynamic Modelp(xt∣xt−1)p(x_t \vert x_{t-1})p(xt∣xt−1)p(yt∣xt)p(y_t \vert x_t)p(yt∣xt)p(x1)p(x_1)p(x1)Discrete State Dynamic Model (HMM)Axt−1,xtA_{x_{t-1}, x_{t}}A
复制链接

扫一扫