蒙特卡罗

xiaoooli

于 2019-11-14 09:37:13 发布

阅读量201

点赞数

分类专栏：个人笔记

本文链接：https://blog.csdn.net/qq_40230900/article/details/103060168

版权

个人笔记专栏收录该内容

20 篇文章 0 订阅

订阅专栏

线性，高斯卡尔曼滤波存在解析解
非线性(高斯或非高斯) 粒子滤波不存在解析解，只能通过采样(蒙特卡罗)的方式加以估计

观测方程 $z_t=g(z_{t-1}, \mu, \varepsilon )$

状态方程 $x_t=g(z_{t}, \mu, \delta )$

滤波问题,求解 $P(z_t|x_1,\cdots,x_t)$

预测( $z_t$ 先验)： $P(z_t|x_1,\cdots,x_{t-1})=\int_{z_{t-1}}P(z_t|z_{t-1})P(z_{t-1}|x_1,\cdots,x_{t-1})d_{z_{t-1}}$

更新( $z_t$ 后验)： $P(z_t|x_1,\cdots,x_{t}) \propto P(x_t|z_t)P(z_t|x_1,\cdots,x_{t-1})$

状态参数符合马尔科夫模型：仅相连时刻的状态参数 $z_{t-1}$ 和 $z_t$ 间存在关联

观测独立假设：观测值间独立

首先来看预测问题，
$P(z_t|x_1,\cdots,x_{t-1}) = \int_{z_{t-1}}P(z_t,z_{t-1}|x_1,\cdots,x_{t-1})d_{z_{t-1}}$
$\int_{z_{t-1}}P(z_t|z_{t-1}，x_1,\cdots,x_{t-1})P(z_{t-1}|x_1,\cdots,x_{t-1})d_{z_{t-1}}$
$\int_{z_{t-1}}P(z_t|z_{t-1})P(z_{t-1}|x_1,\cdots,x_{t-1})d_{z_{t-1}}$

第一行：首先通过 $z_{t-1}$ 架起 $z_t$ 和 $x_{t-1}$ 的桥梁；

第二行：提出 $z_{t-1}$ 和 $z_t$ 间的关系；

第三行：马尔科夫及 $t - 1$ 时刻更新；

接下来看更新问题，主要是寻找 $P(z_t|x_1,\cdots,x_{t})$ 与前边预测的关系：
$P(z_t|x_1,\cdots,x_{t}) = \frac{P(x_1, \cdots, x_t, z_t)}{P(x_1, \cdots, x_t)}$
$\frac{1}{C}P(x_1, \cdots, x_t, z_t)$
$\frac{1}{C}P(x_t|x_1, \cdots, x_{t-1}, z_t)P(x_1, \cdots, x_{t-1}, z_t)$
$\frac{1}{C}P(x_t|x_1, \cdots, x_t, z_t)P(z_t|x_1, \cdots, x_{t-1})P(x_1, \cdots, x_{t-1})$
$\frac{D}{C}P(x_t|x_1, \cdots, x_t, z_t)P(z_t|x_1, \cdots, x_{t-1})$

第一行：提出 $z_t$ 和 $x_t$ 间的关系；

第二行： $P(x_1, \cdots, x_t)$ 是已知的观测值，与 $z_t$ 没有关系，当做一个确定的常量，记作C；

第三行： $P(z_t|x_1, \cdots, x_{t-1})$ 是预测量， $P(x_1, \cdots, x_{t-1})$ 是一个确定的常量，记作D；

重要性采样

非线性问题没有办法得到解析解，必须借助采样的方式估计，通常使用蒙特卡罗采样。

蒙卡特罗法：用抽样的方式来近似估计后验 $P (z ∣ x)$

首先来看他的期望
$E_{z|x}[f(z)] = \int f(z)P(z)dx\approx \frac{1}{N}\sum_{i=1}^{N} f(z^{(i)})$

第二行：分布 $P (z)$ 采样N个样本 $z^{(i)}:z^{(1)}, \cdots, z^{(N)}$

即可通过抽样的方式估计出分布的期望。

重要性采样
$E_{z|x}[f(z)] = \int f(z)P(z)dz$
$\int f(z)\frac{P(z)}{Q(z)}Q(z)dz$
$\sum_{i=1}^{N} f(z^{(i)})\frac{P(z^{(i)})}{Q(z^{(i)})}$
由于 $P (x)$ 通常是一个非常复杂的分布，无法通过上式求得分布的期望，这个时候引入提议分布 $Q (z)$ ,此时我们根据分布 $Q (z)$ 来
抽样 $z^{(i)}\sim Q(z),i=1,2\cdots, N$ ，从而避开了复杂的分布 $P (x)$ 。令式中 $\frac{P(z^{(i)})}{Q(z^{(i)})}=w_{i}$ ，
为权重。

再来观察滤波问题的后验 $P(z_t|x_{1:t})$ 。设 $w_t^{(i)}=\frac{P(z_t^{(i)}|x_{1:t})}{Q(z_t^{(i)}|x_{1:t})}$

时刻 $t=1:w_1^{(i)}, i=1,\cdots, N$

时刻 $t=t:w_t^{(i)}, i=1,\cdots, N$

上式计算 $w_t^{(i)}$ 都要计算 $P(z_t^{(i)}|x_{1:t})$ ，而这个量是很难计算的，那么能不能通过前一个时刻 $w_{t-1}^{(i)}$
稍作计算就可以求得下一时刻的 $w_t^{(i)}$ 。

序贯重要性采样 squential important sampling:寻找 $w_{t-1}^{(i)}$ 和 $w_t^{(i)}$ 的递推关系
$P(z_{1:t}|x_{1:t}) = \frac{P(z_{1:t},x_{1:t})}{P(x_{1:t}) }=\frac{1}{C}P(z_{1:t},x_{1:t})$
$\frac{1}{C}P(x_{t}|z_{1:t},x_{1:t-1})P(z_{1:t},x_{1:t-1})$
$\frac{1}{C}P(x_{t}|z_{t})P(z_t|z_{1:t-1},x_{1:t-1})P(z_{1:t-1},x_{1:t-1})$
$\frac{1}{C}P(x_{t}|z_{t})P(z_t|z_{t-1})P(z_{1:t-1}|x_{1:t-1})P(x_{1:t-1})$
$\frac{D}{C}P(x_{t}|z_{t})P(z_t|z_{t-1})P(z_{1:t-1}|x_{1:t-1})$

令 $D=P(x_{1:t-1})$ .

$Q(z_{1:t}|x_{1:t}) = Q(z_{t}|z_{1:t-1},x_{1:t})Q(z_{1:t-1}|x_{1:t})Q(x_{1:t})$
$Q(z_{t}|z_{1:t-1},x_{1:t})Q(z_{1:t-1}|x_{1:t-1})$

$Q(x_{1:t})$ 为已知常量，记为E。

因此
$w_{t}^{i} \propto \frac{P(z_{1:t}|x_{1:t})}{Q(z_{1:t}|x_{1:t})} \propto \frac{P(x_{t}|z_{t})P(z_t|z_{t-1})P(z_{1:t-1}|x_{1:t-1})} {Q(z_{t}|z_{1:t-1},x_{1:t})Q(z_{1:t-1}|x_{1:t-1})}$
$=\frac{P(x_{t}|z_{t})P(z_t|z_{t-1})} {Q(z_{t}|z_{1:t-1},x_{1:t})}w_{t-1}^{i}$

ParticleFilter
$w_{t}^{i} \propto \frac{P(x_{t}|z_{t})P(z_t|z_{t-1})} {Q(z_{t}|z_{1:t-1},x_{1:t})}w_{t-1}^{i}$

$P(x_{t}|z_{t})$ 是观测概率， $P(z_t|z_{t-1})$ 是预测概率。

算法描述

t-1时刻:采样已完成， $w_{t}^{(i)}$ 已知

t时刻:通过 $Q(z_{t}|z_{1:t-1},x_{1:t})$ 分布对 $z_{t}^{(i)}$ 采样；
$w_{t}^{i} \propto \frac{P(x_{t}|z_{t})P(z_t|z_{t-1})}{Q(z_{t}|z_{1:t-1},x_{1:t})}w_{t-1}^{i}$

存在问题：权值退化
resampling 或者选择一个合适的提议分布Q(z)

重采方法很多中，此处选择系统重采样方式

SIS+resampling = basic ParticleFilter

提议分布分布的选择，好的提议分布是什么样的？
选择 $Q(z_{t}|z_{1:t-1},x_{1:t})=P(z_{t}|z_{t-1})$ ,则
$w_{t}^{i} \propto P(x_{t}|z_{t})w_{t-1}^{i}$ ，直观上的理解如果预测的权重大，那么他的权重也大，这也是容易理解的

xiaoooli

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
蒙特卡罗

线性，高斯卡尔曼滤波存在解析解非线性(高斯或非高斯) 粒子滤波不存在解析解，只能通过采样(蒙特卡罗)的方式加以估计观测方程zt=g(zt−1,μ,ε)z_t=g(z_{t-1}, \mu, \varepsilon )zt=g(zt−1,μ,ε)状态方程xt=g(zt,μ,δ)x_t=g(z_{t}, \mu, \delta )xt=g(zt,μ,δ)滤波问题,求解P(zt...
复制链接

扫一扫