基于贝叶斯准则的状态概率更新

最新推荐文章于 2024-08-06 19:43:22 发布

liverpool的T9

最新推荐文章于 2024-08-06 19:43:22 发布

阅读量3.3k

点赞数

分类专栏： Robotic Estimation Learning 文章标签：贝叶斯准则测量更新后验估计

本文链接：https://blog.csdn.net/weixin_43010548/article/details/89891613

版权

Robotic Estimation Learning 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

$\quad$ 基于贝叶斯准则表达获取测量值后的状态概率更新
$\qquad$ 首先关于 $Z = z$ 的贝叶斯准则，只要 $p (y ∣ z) > 0$ ：
$p(x|y,z)=\frac{p(y|x,z)p(x|z)}{p(y|z)}$
在这里插入图片描述
$\qquad$ 由概率生成法则可得在获取测量值后状态概率的更新(目标后验)表达式
$p(x_{t}|z_{1:t},u_{1:t})=p(x_{t}|z_{t},z_{1:t-1},u_{1:t})=\frac{p(z_{t}|x_{t},z_{1:t-1},u_{1:t})p(x_{t}|z_{1:t-1},u_{1:t})}{p(z_{t}|z_{1:t-1},u_{1:t})}$ 此时 $z_{1:t-1},u_{1:t}$ 看作上式的条件 $Z$ 。
$\qquad$ 依据伯努利分布(Bernoulli distribution)建模， $\theta_{g}=1$ 表示检测到目标，其概率使用 $P_{i,k}(\theta_{g}=1)$ 表示。 $\theta_{g}=0$ 表示未检测到目标，其概率使用 $1-P_{i,k}(\theta_{g}=1)$ 表示。
$\qquad$ 其中， $i$ 表示第 $i$ 个机器人， $g$ 表示概率密度栅格图中第 $g$ 个栅格， $k$ 表示第 $k$ 个时间点。使用符号 $\mathcal{P}_{i,g,k}$ 定义概率 $P_{i,k}(\theta_{g}=1)$ 。则测量更新表达式为：
$\mathcal{P}_{i,g,k}=\frac{P(Z_{i,g,k}|\theta_{g}=1)\mathcal{P}_{i,g,k-1}}{P(Z_{i,g,k}|\theta_{g}=1)\mathcal{P}_{i,g,k-1}+P(Z_{i,g,k}|\theta_{g}=0)(1-\mathcal{P}_{i,g,k-1})}$ $\qquad$ 使用伯努利分布建模后的测量更新与一般式的不同表现在 $\color{#F00}{归一化常数\eta使用测量概率的全概率公式表示}$ 。
$\qquad$ 令 $P(Z_{i,g,k}=1|\theta_{g}=1)=p,P(Z_{i,g,k}=1|\theta_{g}=0)=q$ ，则
$\mathcal{P}_{i,g,k}=\begin{cases} \frac{p\mathcal{P}_{i,g,k-1}}{p\mathcal{P}_{i,g,k-1}+q(1-\mathcal{P}_{i,g,k-1})}\quad if\ Z_{i,g,k}=1,\\ \frac{(1-p)\mathcal{P}_{i,g,k-1}}{(1-p)\mathcal{P}_{i,g,k-1}+(1-q)(1-\mathcal{P}_{i,g,k-1})}\quad if\ Z_{i,g,k}=0,\\ \mathcal{P}_{i,g,k-1}\quad otherwise. \end{cases}$ 化简得：
$\frac{1}{\mathcal{P}_{i,g,k}}-1=\begin{cases} \frac{q}{p}(\frac{1}{\mathcal{P}_{i,g,k}-1}-1),\quad if\ Z_{i,g,k}=1\\ \frac{1-q}{1-p}(\frac{1}{\mathcal{P}_{i,g,k}-1}-1),\quad if\ Z_{i,g,k}=0\\ \frac{1}{\mathcal{P}_{i,g,k-1}}-1,\quad otherwise. \end{cases}$ 对其取 $l n$ 运算，则
$Q_{i,g,k}\overset{\Delta}{=}ln(\frac{1}{{P}_{i,g,k-1}}-1)$ 则
$Q_{i,g,k}=Q_{i,g,k-1}+v_{i,g,k}$ 其中：
$v_{i,g,k}\overset{\Delta}{=}\begin{cases} ln\frac{q}{p},\quad if\ Z_{i,g,k}=1\\ ln\frac{1-q}{1-p},\quad if\ Z_{i,g,k}=0\\ 0,\quad otherwise. \end{cases}$ $\qquad$ 由此，当目标存在时， $Q_{i,g,k}$ 趋向于 $-\infty$ ，即 $\mathcal{P}_{i,g,k}$ 趋向于1。当目标不存在时， $Q_{i,g,k}$ 趋向于 $+\infty$ ，即 $\mathcal{P}_{i,g,k}$ 趋向于0。
$\qquad$ 其中潜在的问题是存储 $Q_{i,g,k}$ 过程中会出现数值过大，存储溢出的情况。给定边界 $\boldsymbol{Q}>0$ ，使得
$Q_{i,g,k}=max\{min(Q_{i,g,k},\boldsymbol{Q}),-\boldsymbol{Q}\}$ $\qquad$ 则 $\mathcal{P}_{i,g,k}\in[(1/(1+e^{\boldsymbol{Q}})),(1/(1+e^{\boldsymbol{-Q}})]$ ， $\boldsymbol{Q}$ 需要足够大使得 $P_{i,g,k}$ 接近(0,1)。