贝叶斯滤波和粒子滤波

anthony-36

已于 2022-07-19 22:32:53 修改

阅读量799

点赞数 4

分类专栏：激光SLAM 滤波贝叶斯文章标签：算法机器学习

于 2022-07-19 22:31:41 首次发布

本文链接：https://blog.csdn.net/qq_46067306/article/details/125882508

版权

激光SLAM 同时被 3 个专栏收录

3 篇文章 0 订阅

订阅专栏

滤波

3 篇文章 0 订阅

订阅专栏

贝叶斯

2 篇文章 0 订阅

订阅专栏

贝叶斯滤波，状态估计，频率学派，一系列统称，

粒子滤波是贝叶斯滤波的特例（实现方式）、粒子耗散问题（不能解决）、FastSLAM

一、贝叶斯滤波

1.数学概念

2.特性

估计的是概率分布，不是具体数值；

极大似然估计、极大后验估计

是一大类方法的统称；
是一个抽象的表达形式——对于不同问题有不同的实现方式（卡尔曼家族、粒子滤波）；
迭代估计形式

3.贝叶斯估计

$bel(x_t)=p(x_t|z_{1:t},u_{1:t})=\eta p(z_t|x_t)\overline{bel}(x_t)=\eta p(z_t|x_t)\begin{aligned} \int p(x_t|x_{t-1},u_t)p(x_{t-1}|z_{1:t-1,}u_{1:t-1}) \mathrm{d} x_{t-1} \end{aligned}\tag{1-1}$

$bel(x_t)$ 是后验概率——观测更新
$\overline{bel}(x_t)$ 是预测分布——运动预测

$[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-VeK4rrJl-1658240908390)(C:\Users\13611\AppData\Roaming\Typora\typora-user-images\image-20220719162830611.png)]$

功能：已知状态量t-1时刻的概率分布，在给定t时刻的观测数据 $z_t,u_t)$ 的情况下估计出状态量在t时刻的概率分布

4.推导

目标：在已知 $p(x_{t-1}|z_{1:t-1,}u_{1:t-1})、u_t、z_t$ 的情况下，得到 $p(x_t|z_{1:t},u_{1:t})$ 的表达式。

$p(x_t|z_{1:t},u_{1:t})=\frac{p(z_t|x_t,z_{1:t-1},u_{1:t})p(x_t|z_{1:t-1},u_{1:t})}{p(z_t|z_{1:t-1,u_{1:t}})}\\ \\=\eta p(z_t|x_t,z_{1:t-1},u_{1:t})p(x_t|z_{1:t-1},u_{1:t})$

其中：

$p(z_t|x_t,z_{1:t-1},u_{1:t})=p(z_t|x_t)$

$p(x_t|z_{1:t-1},u_{1:t})= \begin{aligned} \int p(x_t|x_{t-1},z_{1:t-1},u_{1:t})p(x_{t-1}|z_{1:t-1},u_{1:t})\mathrm{d} x_{t-1} \end{aligned}$

$p(x_t|x_{t-1},z_{1:t-1},u_{1:t})=p(x_t|x_{t-1},u_t)$

$p(x_{t-1}|z_{1:t-1},u_{1:t})=p(x_{t-1}|z_{1:t-1,}u_{1:t-1})$

令：

$bel(x_t)=p(x_{t}|z_{1:t},u_{1:t})$ 表示 $x_t$ 的后验概率分布

$\overline{bel}(x_t)=p(x_{t}|z_{1:t},u_{1:t})$ 表示 $x_t$ 的预测（proposal）概率分布

则：

$bel(x_t)=\eta p(z_t|x_t)\overline{bel}(x_t)$

$\overline{bel}(x_t)= \begin{aligned} \int p(x_t|x_{t-1},u_t)p(x_{t-1}|z_{1:t-1,}u_{1:t-1}) \mathrm{d} x_{t-1} \end{aligned}$

2.粒子滤波

粒子滤波用一系列通过后验概率分布随机采样的状态粒子近似表示后验概率分布，采样得到的状态粒子点的疏密程度与该区域后验概率分布大小成正比，也就是说状态粒子点的枢密程度简介反映了后验概率分布的大小。这样粒子就可以直接参与系统的非线性变换，并利用运动和观测进行重新采样以调整状态粒子点的疏密程度。

粒子算法是一种基于遗传进化的算法，粒子经过运动和观测过程的筛选后，粒子点将逐渐集中到后验概率高的区域。

1.特性

贝叶斯估计器的一种实现方式
能处理非线性情况
能处理多峰分布的情况——全局定位
用系列粒子近似概率分布
非参滤波器

2.推导

$ X={ {(x_t^i,w_ti)|i=1,2,…,n} } $

$x_t^i$ 表示一个状态的假设——机器人位姿

$w_t^i$ 表示假设的权重——跟地图的匹配度

流程

用粒子进行状态传播： $x_{t}^i$ ~ $p(x_t|u_t,x_{t-1}^i)$
评估每个粒子的权重： $w_{t}^i=\eta p(z_t|x_t)$
根据权重进行重采样：以 $w_{t}^i$ 的概率接受 $x_{t}^i$ ，权重清零

①状态传播

传播模型：
$\overline{bel}(x_t)= \begin{aligned} \int p(x_t|x_{t-1},u_t)p(x_{t-1}|z_{1:t-1,}u_{1:t-1}) \mathrm{d} x_{t-1} \end{aligned}$
已知t-1时刻的概率分布（粒子分布）：
$p(x_{t-1}|z_{1:t-1,}u_{1:t-1}) ={{(x_{t-1}^i,w_{t-1}^i)|i=1,2,...,n}}$
根据数据 $u_t$ 预测t-1时刻的概率分布（粒子分布）：

$x_{t}^i \backsim p(x_t|u_t,x_{t-1}^i)\\ i=1,2,....,n$
在这里插入图片描述

②权重评估

无法知道机器人位姿的实际分布
从机器人的预测分布进行采样，联合权重一起近似机器人的后验概率分布
权重用来评估实际的预测分布和实际分布的差，差越大，权重越小
权重的定义

$w=\frac{bel(x_t)}{\overline{bel}(x_t)}$

对于某个粒子：
$bel(x_t)=\eta p(z_t|x_t)p(x_t|x_{t-1},u_t)bel(x_t) \\ \overline{bel}(x_t)= p(x_t|x_{t-1},u_t)bel(x_t)$
因此权重为：
$w=\frac{\eta p(z_t|x_t)p(x_t|x_{t-1},u_t)bel(x_t)}{p(x_t|x_{t-1},u_t)bel(x_t)}\\ \\ =\eta p(z_t|x_t)$
请添加图片描述