粒子滤波(particle filter)

最新推荐文章于 2023-07-07 18:58:01 发布

prupcognition

最新推荐文章于 2023-07-07 18:58:01 发布

阅读量354

点赞数

分类专栏：机器学习算法基础数学

本文链接：https://blog.csdn.net/m0_37896765/article/details/99308350

版权

机器学习算法同时被 2 个专栏收录

17 篇文章 0 订阅

订阅专栏

基础数学

10 篇文章 1 订阅

订阅专栏

粒子滤波也属于动态模型中的一种，但是隐变量之间的关系不在是线性的关系，而是满足一定的高次函数关系：
状态方程： $z_t = f(z_{t-1},u_t,\varepsilon_t)$
观测方程： $x_t=h(z_{t},\delta_t)$
在这里插入图片描述
由于是非线性函数关系，所以很难直接计算后验概率 $p(z_t|x_t)$ ，在很多应用中：
计算后验概率就是为了计算函数的期望值，所以可以使用蒙特卡洛抽样的方法计算期望
这里回顾一下重要性采样公式：
$=\int_z p(z)f(z) dx=\int_z \displaystyle \frac{p(z)q(z)}{q(z)}f(z) dz$
$=\int_x \displaystyle q(z)f(z)\frac{p(z)}{q(z)} dz$
$=\displaystyle \frac{1}{n} \sum_{i=1}^n f(z_i)\frac{p(z)}{q(z)}$
$=\displaystyle \frac{1}{n} \sum_{i=1}^n f(z_i)w_i$

这里指的是：
$p(z) =p(z_t|x_t)$
$q(z) =q(z_t|x_t)$
$\displaystyle \frac{p(z)}{q(z)}$ 称为权重，记作W,
可以看到，对于 $\in 1,...,n,每次都需要计算W，而且W的计算也比较复杂$
想法：能否找到一种计算W的迭代方法，使得计算量比较小
由此引出序列重要采样(sis)(sequential importance sample)：
$p(z_{1,...t}|x_{1,...,t}),求在给定x_{1,...,t}情况下，z_{1,...t}的概率，$
$根据齐次马尔科夫假设，求出了p(z_{1,...t}|x_{1,...,t})，也就求出了p(z_t|x_t)$ ,
所以： $w_t \propto \displaystyle \frac{p(z_{1,...t}|x_{1,...,t})}{q(z_{1,...t}|x_{1,...,t})}$
之所以写成序列的形式，是因为这样容易构造迭代公式
迭代公式推导：
$令：w_t = \displaystyle \frac{p(z_{1,...t}|x_{1,...,t})}{q(z_{1,...t}|x_{1,...,t})}$
$p(z_{1,...t}|x_{1,...,t})$
$\displaystyle \frac {p(z_{1,...t},x_{1,...,t})}{p(x_{1,...,t})},由于p(x_{1,...,t})可以直接计算，这里可作为常量C$
$\displaystyle \frac {1}{C}p(z_{1,...t},x_{1,...,t}), 提出x_t有：$
$\displaystyle \frac {1}{C}p(x_t|z_{1,...t},x_{1,...,{t-1}}) p(z_{1,...t},x_{1,...,{t-1}}),提出z_t有：$
$\displaystyle \frac {1}{C}p(x_t|z_t) p(z_t|z_{1,...t-1},x_{1,...,{t-1}})p(z_{1,...t-1},x_{1,...,{t-1}})$
应用齐次马尔科夫条件有：
$\displaystyle \frac {1}{C}p(x_t|z_t) p(z_t|z_{t-1})p(z_{1,...t-1},x_{1,...,{t-1}})$
应用贝叶斯展开联合概率有：
$\displaystyle \frac {1}{C}p(x_t|z_t) p(z_t|z_{t-1})p(z_{1,...t-1}|x_{1,...,{t-1}})p(x_{1,...,{t-1}})$
$p(x_{1,...,{t-1}})也可以直接求出，这里作为常量D有：$

$\displaystyle \frac {D}{C}p(x_t|z_t) p(z_t|z_{t-1})p(z_{1,...t-1}|x_{1,...,{t-1}})$

$q(z_{1,...t}|x_{1,...,t})$
$\displaystyle \frac {q(z_{1,...t},x_{1,...,t})}{q(x_{1,...,t})}$ //分母由于可以直接求出，可以忽略
$q(z_t|z_{1,...t-1},x_{1,...,t})q(z_{1,...t-1},x_{1,...,t})$
$q(z_t|z_{1,...t-1},x_{1,...,t})q(x_t|z_{1,...t-1}|x_{1,...,t-1})q(z_{1,...t-1},x_{1,...,t})$
$\propto q(z_t|z_{1,...t-1},x_{1,...,t})q(x_t|z_{1,...t-1}|x_{1,...,t-1})q(z_{1,...t-1}|x_{1,...,t})$
假定可以写成：（不知道为何可以这样假定）
$\propto q(z_t|z_{1,...t-1},x_{1,...,t})q(z_{1,...t-1}|x_{1,...,t})$
所以有：
$w_t = \displaystyle \frac{p(z_{1,...t}|x_{1,...,t})}{q(z_{1,...t}|x_{1,...,t})}$
$=\displaystyle \frac{p(x_t|z_t) p(z_t|z_{t-1})p(z_{1,...t-1}|x_{1,...,{t-1}})} {q(z_t|z_{1,...t-1},x_{1,...,t})q(z_{1,...t-1}|x_{1,...,t})}$

$=\displaystyle \frac{p(x_t|z_t) p(z_t|z_{t-1})} {q(z_t|z_{1,...t-1},x_{1,...,t})}.w_{t-1}$

总结一下sequential importance sample 算法：

$t-1时刻已经计算出w_{t-1}$
对于t时刻：
$\ i=1,...n$
$\quad 从q分布中采样一个样本z_t，z_t \sim q(z_t|z_{1,...t-1},x_{1,...,t})$
$\quad w_t \propto \displaystyle \frac{p(x_t|z_t) p(z_t|z_{t-1})} {q(z_t|z_{1,...t-1},x_{1,...,t})}.w_{t-1}$
$\quad for$
但是序列重要采样实际中会存在权值退化的问题，也就是某些样本的权重值非常接近0，而有些样本的权重值接近1，导致无法正常使用，解决办法分两种：
重采样和找新的q分布

首先看序列重要采样+重采样: $s i s + r$

重采样的思路是：既然那些权重小的不起作用了，那就不要了。要保持采样数目不变，得用一些新的样本来取代它们。找新样本最简单的方法就是将权重大的样本多复制几个出来，至于复制几个？那就在权重大的样本里面让它们根据自己权重所占的比例去分配，也就是老大分身分得最多，老二分得次多，以此类推

在这里用个简单的例子来说明：
假设有3个粒子，在第k时刻的时候，他们的权重分别是0.1, 0.1 ,0.8, 然后计算他们的概率累计和为：[0.1, 0.2, 1]。接着，我们用服从[0,1]之间的均匀分布随机采样3个值，假设为0.15 , 0.38 和 0.54。也就是说，第二个粒子复制一次，第三个粒子复制两次

其次：序列重要采样+重采样+选择合适的q分布:
当取q分布为: $p(z_t|z_{t-1})时，有：$
$\quad w_t \propto \displaystyle \frac{p(x_t|z_t) p(z_t|z_{t-1})} {q(z_t|z_{1,...t-1},x_{1,...,t})}.w_{t-1}= \displaystyle \frac{p(x_t|z_t) p(z_t|z_{t-1})} {p(z_t|z_{t-1})}.w_{t-1}=p(x_t|z_t).w_{t-1}$
从而更进一步简化了运算