蒙特卡洛粒子滤波定位算法_RL-粒子滤波 Particle Filter

a217455a1288beccae2e1c83a925490e.png

前面讲到的Kalman滤波是针对线性高斯的动态模型,当动态模型是非线性非高斯,则可以使用粒子滤波。

eaa7396d2d43cfc33712185bc7819673.png

Particle filter可以应用在物体追踪方面,下面通过一个简单的解释来理解其算法。

我们现在通过放很多只狗来追踪物品,狗则代表的是粒子particle。狗狗会返回一个目标相似度与目标可能位置,相似度则类似于我们下面的权值

,位置则是下文的
。物体可能动来动去,在追踪的过程中,1号狗狗得到的权值很高0.7,其他狗狗可能得到的权值很小。为了提高追踪的效率,可以对他们重新部署,这里就是重采样,因为我们想把尽可能多的狗放在大概率的地方,就是1号狗的位置,其他的例如概率小的位置就少放点狗,甚至不放。

粒子追踪的思路就是循环以下过程:重要性采样(即放狗,搜集每个狗追踪的位置以及权重)+ 重采样(重新放狗)

1. 蒙特卡洛方法

蒙特卡洛的思想就用使用均值代替积分。

对于任意的函数

, 假设
是一个分布,即
,令

它刚好是一个期望; 假设随机变量
服从分布
,则
它也会近似等于

2. 重要性采样 Importance Sampling

首先,我们知道求一个函数

在概率密度函数为
下的期望为

此时, 这个积分比较复杂,于是我们可以通过在

上进行采样,得到
来估计
的期望

这个

比较复杂,于是我们可以引入另一个概率密度函数
(我们熟悉的相对简单的),上述的式子
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值