概率机器人的核心就是由传感器数据来估计状态的思路。状态估计解决的是从不能直接观测但可以推断的传感器数据中估计数量的问题.
首先介绍一维正态分布的概率密度函数:
(1)
我们经常把它记为, 他指出了随机变量及其均值和方差。但是
经常是一个多维矢量。多元正态分布的密度函数有一下形式:
(2)
其中为均值矢量;
为一个半正定对称矩阵称为协方差矩阵。
在SLAM中我们称为信息矩阵。首先解释下半正定对称矩阵,协方差矩阵,信息矩阵以及反对称矩阵。
1)半正定对称矩阵:是由变量之间的协方差来求得的,即对于
这一组随机变量求他们之间的协方差,
(3)
我们知道二个变量之间的协方差跟他们的顺序无关,所以该矩阵是一个对称矩阵,变量与自己的协方差是等于该变量的方差,该矩阵的元素是非负的所以为半正定。
2)信息矩阵:目前还不明白。
3)反对称矩阵:初次接触反对称矩阵是在《SLAM十四讲》中两个向量之间的叉乘
(4)
其中就是一个反对称矩阵。
两个随机变量X和Y的联合分布:
(5)
若这二个变量是独立的,则有:
(6)
接下来就是条件概率:
(7)
同样若两个变量独立,这里就不写了;通过(5-7)我们得到全概率公式:
(8)
(9)
(8)是离散情况下,(9)是连续情况。
贝叶斯准则,该定理将条件概率与其逆概率
同样我们得到贝叶斯公式:
(10)
(11)
其中称为先验概率分布,
称为似然,而
则称为后验概率,我们可以看到贝叶斯公式的分母
它是不依赖于x的,所以贝叶斯公式也经常写为
(12)
可以看到,以任意随机变量(如变量)为条件的迄今为止讨论过的条件概率都非常巧妙。例如,关于
的贝叶斯公式为:
(13)
许多概率算法都要求计算概率分布的特性或者统计,随机变量X的期望值可以由下式给定:
(14)
(15)
(16)
(17)
置信分布,概率机器人通过条件概率分布表示置信度。对于真实的状态,置信度分布为每一个可能的假设分配一个概率。置信度分布是以可获得数据为条件的关于状态变量的后验概率:
(18)
默认置信度是在综合了测量后得到的,有时,可以证明在刚刚执行完控制
之后,综合
之前计算后验是有用的。这样的后验可以表示为:
(19)
在概率滤波的框架下,该概率被称为预测。是基于以前状态的后验,在综合时刻t的测量之间,预测了时刻t的状态。由
计算
称为修正或者测量更新。