卡尔曼滤波|机器学习推导系列（十八）

最新推荐文章于 2023-09-12 19:35:02 发布

酷酷的群

最新推荐文章于 2023-09-12 19:35:02 发布

阅读量735

点赞数 1

分类专栏：机器学习推导系列文章标签：算法机器学习人工智能神经网络数据挖掘

本文链接：https://blog.csdn.net/weixin_42431920/article/details/109407645

版权

机器学习推导系列专栏收录该内容

27 篇文章 10 订阅

订阅专栏

本文介绍了卡尔曼滤波在处理线性高斯模型中的应用，用于描述连续隐变量。线性模型中，状态转移和观测与隐变量之间的关系被详细阐述，并通过类比HMM参数给出卡尔曼滤波的初始概率、转移概率和发射概率形式。过滤问题关注边缘概率的计算，通过前向算法的递推关系解析了预测和更新两个关键步骤。预测阶段涉及高斯分布的积分运算，更新阶段则结合观测信息。最终，给出了预测和更新阶段的高斯分布计算公式。

摘要由CSDN通过智能技术生成

一、概述

HMM 模型适用于隐变量是离散的值的时候，对于连续隐变量的 HMM，常用卡尔曼滤波（Kalman Filtering）描述线性高斯模型的态变量，使用粒子滤波（Particle Filter）来表述非高斯非线性的态变量。

线性体现在上一时刻和这一时刻的隐变量以及隐变量和观测变量之间，它们的关系可以表示为：

$z_{t}=A\cdot z_{t-1}+B+\varepsilon \\ x_{t}=C\cdot z_{t}+D+\delta \\ \varepsilon \sim N(0,Q)\\ \delta \sim N(0,R)$

类比HMM中几个参数，我们也可以写出类似初始概率、转移概率或发射概率的形式：

$P(z_{t}|z_{t-1})\sim N(A\cdot z_{t-1}+B,Q)\\ P(x_{t}|z_{t})\sim N(C\cdot z_{t}+D,R)\\ z_{1}\sim N(\mu _{1},\Sigma _{1})$

所有的参数为：

$\theta =(A,B,C,D,Q,R,\mu _{1},\Sigma _{1})$

二、Filtering问题

在多个inference问题中，卡尔曼滤波更关心Filtering问题，即求边缘概率：

$P(z_{t}|x_{1},x_{2},\cdots ,x_{t})$

类似HMM的前向算法，我们需要找到一个递推关系：

$P(z_{t}|x_{1},x_{2},\cdots ,x_{t})\\ =\frac{P(x_{1},x_{2},\cdots ,x_{t},z_{t})}{P(x_{1},x_{2},\cdots ,x_{t})}\\ \propto P(x_{1},x_{2},\cdots ,x_{t},z_{t})\\ =\underset{P(x_{t}|z_{t})}{\underbrace{P(x_{t}|x_{1},x_{2},\cdots ,x_{t-1},z_{t})}}\cdot P(x_{1},x_{2},\cdots ,x_{t-1},z_{t})\\ =P(x_{t}|z_{t})\cdot P(x_{1},x_{2},\cdots ,x_{t-1},z_{t})\\ =P(x_{t}|z_{t})\cdot \underset{prediction问题} {\underbrace{P(z_{t}|x_{1},x_{2},\cdots ,x_{t-1})}}\cdot P(x_{1},x_{2},\cdots ,x_{t-1})\\ \propto P(x_{t}|z_{t})\cdot P(z_{t}|x_{1},x_{2},\cdots ,x_{t-1})$

上式结果中， $P(x_{t}|z_{t})$ 已知，而另一项可做以下转化：

$P(z_{t}|x_{1},x_{2},\cdots ,x_{t-1})\\ =\int _{z_{t-1}}P(z_{t},z_{t-1}|x_{1},x_{2},\cdots ,x_{t-1})\mathrm{d}z_{t-1}\\ =\int _{z_{t-1}}\underset{P(z_{t}|z_{t-1})}{\underbrace{P(z_{t}|z_{t-1},x_{1},x_{2},\cdots ,x_{t-1})}}\cdot \underset{Filtering问题}{\underbrace{P(z_{t-1}|x_{1},x_{2},\cdots ,x_{t-1})}}\mathrm{d}z_{t-1}\\ =\int _{z_{t-1}}P(z_{t}|z_{t-1})\cdot P(z_{t-1}|x_{1},x_{2},\cdots ,x_{t-1})\mathrm{d}z_{t-1}$

因此，我们找到了Filtering问题的递推式：

${\color{Red}{P(z_{t}|x_{1},x_{2},\cdots ,x_{t})}}=C\cdot P(x_{t}|z_{t})\cdot \int _{z_{t-1}}P(z_{t}|z_{t-1})\cdot {\color{Red}{P(z_{t-1}|x_{1},x_{2},\cdots ,x_{t-1})}}\mathrm{d}z_{t-1}$

因此，我们可以确定求解Filtering问题的步骤如下：

$t=1\left\{\begin{matrix} P(z_{1}|x_{1})\rightarrow update\\ P(z_{2}|x_{1})\rightarrow prediction \end{matrix}\right.\\ t=2\left\{\begin{matrix} P(z_{2}|x_{1},x_{2})\rightarrow update\\ P(z_{3}|x_{1},x_{2})\rightarrow prediction \end{matrix}\right.\\ \vdots \\ t\left\{\begin{matrix} P(z_{t}|x_{1},x_{2},\cdots ,x_{t})\rightarrow update\\ P(z_{t+1}|x_{1},x_{2},\cdots ,x_{t})\rightarrow prediction \end{matrix}\right.$

很明显这是一个online的过程。

三、Filtering问题求解

通过上述转化我们可以确定Filtering问题的计算是通过以下两步迭代计算进行的：

Step1 Prediction:
$P(z_{t}|x_{1},x_{2},\cdots ,x_{t-1})=\int _{z_{t-1}}P(z_{t}|z_{t-1})\cdot P(z_{t-1}|x_{1},x_{2},\cdots ,x_{t-1})\mathrm{d}z_{t-1}$
Step2 Update:
$P(z_{t}|x_{1},x_{2},\cdots ,x_{t})=C\cdot P(x_{t}|z_{t})\cdot P(z_{t}|x_{1},x_{2},\cdots ,x_{t-1})$

我们可以确定的是几个高斯分布经过相乘或者积分运算后仍然是高斯分布，所以我们假设：

$Prediction:P(z_{t}|x_{1},x_{2},\cdots ,x_{t-1})=N(z_{t}|\mu _{t}^{*},\Sigma _{t}^{*})\\ Update:P(z_{t}|x_{1},x_{2},\cdots ,x_{t})=N(z_{t}|\mu _{t},\Sigma _{t})$

代入高斯分布的形式可以得到：

$Prediction:N(z_{t}|\mu _{t}^{*},\Sigma _{t}^{*})=\int _{z_{t-1}}N(z_{t}|A\cdot z_{t-1}+B,Q)\cdot N(z_{t-1}|\mu _{t-1},\Sigma _{t-1})\cdot \mathrm{d}z_{t-1} \\ Update:N(z_{t}|\mu _{t},\Sigma _{t})=C\cdot N(x_{t}|C\cdot z_{t}+D,R)\cdot N(z_{t}|\mu _{t}^{*},\Sigma _{t}^{*})$

接下来的求解需要用到高斯分布|机器学习推导系列（二）第六部分内容中我们得到的结论，即已知 $P (x)$ 和 $P (y ∣ x)$ 来求 $P (y)$ 和 $P (x ∣ y)$ ，这里我们直接套用公式即可。

首先，在Prediction过程中：

$\underset{P(y)}{\underbrace{P(z_{t}|x_{1},x_{2},\cdots ,x_{t-1})}}=\int _{z_{t-1}}\underset{P(y|x)}{\underbrace{P(z_{t}|z_{t-1})}}\cdot \underset{P(x)}{\underbrace{P(z_{t-1}|x_{1},x_{2},\cdots ,x_{t-1})}}\mathrm{d}z_{t-1}$

代入计算 $P (y)$ 的公式可得：

$\mu _{t}^{*}=A\mu _{t-1}+B\\ \Sigma _{t}^{*}=Q+A\Sigma _{t-1}A^{T}$

在update过程中：

$\underset{P(x|y)}{\underbrace{P(z_{t}|x_{1},x_{2},\cdots ,x_{t})}}=C\cdot \underset{P(y|x)}{\underbrace{P(x_{t}|z_{t})}}\cdot \underset{P(x)}{\underbrace{P(z_{t}|x_{1},x_{2},\cdots ,x_{t-1})}}$

代入计算 $P (x ∣ y)$ 的的公式也可以得出结果，过程比较复杂，所以省略。

注意这里将 $x_{1},x_{2},\cdots ,x_{t-1}$ 看做已知即可，然后再套用 $p (x)$ 、 $p (y ∣ x)$ 等形式。

另外这里只需要根据公式直接套用得出结果即可，具体的得出的Prediction和Update计算公式并没有用到。

酷酷的群

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
卡尔曼滤波|机器学习推导系列（十八）

一、概述HMM 模型适用于隐变量是离散的值的时候，对于连续隐变量的 HMM，常用卡尔曼滤波（Kalman Filtering）描述线性高斯模型的态变量，使用粒子滤波（Particle Filter）来表述非高斯非线性的态变量。线性体现在上一时刻和这一时刻的隐变量以及隐变量和观测变量之间，它们的关系可以表示为：zt=A⋅zt−1+B+εxt=C⋅zt+D+δε∼N(0,Q)δ∼N(0,R)z_{t}=A\cdot z_{t-1}+B+\varepsilon \\x_{t}=C\cdot z_{t}+
复制链接

扫一扫

专栏目录