1 概率机器人 Probabilistic Robotics 概率基本概念

Fengyu19930920

已于 2024-08-22 09:09:13 修改

阅读量666

点赞数

分类专栏：概率机器人滤波 Robot 文章标签：概率论机器学习

于 2020-09-27 09:04:13 首次发布

本文链接：https://blog.csdn.net/fengyu19930920/article/details/108820680

版权

Robot 同时被 3 个专栏收录

17 篇文章

订阅专栏

概率机器人

11 篇文章

订阅专栏

滤波

11 篇文章

订阅专栏

本文介绍概率机器人领域的基本概念，包括随机变量、概率分布、条件概率等，并探讨了条件独立性、期望、协方差及熵的概念。此外还介绍了置信度的定义及测量更新的过程。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

基本概念

本片博文为后续博文做基础铺垫，给出符号和基本公式的定义：

随机变量 $X$ 的值为 $x$ : $p (X = x)$ 简写为 $p (x)$
$\sum_xp(x) = 1 ~~~~~~~~~\text{离散}\\ \int p(x)dx=1 ~~~~~~~\text{连续}\tag{1.1}$
正态分布 $N(x;u,\sigma^2)$ ：
$(2\pi\sigma^2)^{-\frac{1}{2}}\exp\left \{ -\frac{1}{2} \frac{(x-\mu)^2}{\sigma^2}\right \}\\ \downarrow \text{多维}\\ p(x) = det(2\pi\Sigma^2)^{-\frac{1}{2}}\exp\left \{ -\frac{1}{2} (x-\mu)^T\Sigma^{-1}(x-\mu)\right \}\tag{1.2}$
联合分布：
$\cup Y=y)\\ \downarrow X,Y\text{独立}\\ p(x,y) = p(x)p(y)\tag{1.3}$
条件分布：
$p(X=x|Y=y)\\ \downarrow\\ p(x|y) =\frac{p(x,y)}{p(y)}\\ \downarrow X,Y\text{独立}\\ p(x|y) =\frac{p(x)p(y)}{p(y)} = p(x)\tag{1.4}$
全概率公式：
$\sum_y p(x|y)p(y) ~~~~~~ \text{离散}\\ p(x) = \int p(x|y)p(y)dy ~~~~~~ \text{连续}\tag{1.5}$
贝叶斯准则:（很重要）
$=\frac{p(y|x)p(x)}{p(y)} = \frac{p(y|x)p(x)}{\sum_{x'}p(y|x')p(x')} ~~~~~~ \text{离散}\\ p(x|y) =\frac{p(y|x)p(x)}{p(y)} = \frac{p(y|x)p(x)}{\int p(y|x')p(x')dx'} ~~~~~~ \text{连续}\\ \downarrow p(y)^{-1}\text{被写为}\eta\\ p(x|y) = \eta p(y|x)p(x)\tag{1.6}$
多变量条件概率：
$=\frac{p(y|x,z)p(x|z)}{p(y|z)}\tag{1.7}$
条件概率的独立性(X,Y独立)：
$p(x|z)p(y|z)\\ p(x|z) = p(x|z,y)\\ p(y|z) = p(y|z,x)\tag{1.8}$
条件独立不一定绝对独立，绝对独立不一定条件独立：
$\begin{aligned} p(x,y|z) = p(x|z)p(y|z) &\nRightarrow p(x,y) = p(x)p(y)\\ p(x,y) = p(x)p(y) &\nRightarrow p(x,y|z) = p(x|z)p(y|z)\tag{1.9} \end{aligned}$
期望：
$\sum_x xp(x) ~~~~~~ \text{离散}\\ E[X] = \int xp(x)dx ~~~~~~ \text{连续}\\\tag{1.10} \downarrow\\ E[aX + b] = aE[X] +b$
协方差：
$E[X-E[X]]^2 = E[X^2] - E[X]^2\tag{1.11}$
熵：
$H_p(x) = E[-\log_2p(x)]\\ \downarrow\\ H_p(x) = -\sum_x p(x)\log_2p(x) ~~~~~~ \text{离散}\\ H_p(x) = \int p(x)\log_2p(x)dx ~~~~~~ \text{连续}\\\tag{1.12}$
测量值 $z$ ：
$z_{t_1:t_2} = z_{t_1}, z_{t_1+1}, z_{t_1+2}, \cdots, z_{t_2}\tag{1.13}$
控制值 $u$ ：
$u_{t_1:t_2} = u_{t_1}, u_{t_1+1}, u_{t_1+2}, \cdots, u_{t_2}\tag{1.14}$
条件独立性的例子：
- 状态变量 $x_t$ 仅与状态 $x_{t-1}$ 和控制量 $u_t$ 有关
- 观测值 $z_t$ 仅与状态 $x_{t}$ 有关