2.3.4 Belief Distributions 状态认知分布
Belief 是概率机器人学另一个关键概念。Belief 反映了机器人对于环境状态的认知。我们已经讨论过有些状态是无法直接测量的。例如,机器人的位置姿态可能是在全局坐标系的 x=(14.12,12.7,0.755) ,但也有可能无法直接获取(即使有GPS也不行!)。在无法直接测量的情况下,机器人必须从数据中推断他的位置姿态。因此,我们需要区分真实的状态(true state)和机器人内部的belief,或者称为对应此状态的状态认知(state of knowledge)。
概率机器人学通过条件概率分布(conditional probability distributions)来表达状态认知belief。一个状态认知分布(belief distribution)会给对应真实状态每个可能的假定值一个概率(或者密度值)。belief 分布是关于状态变量的后验概率,并且以数据为条件。我们用
bel(xt)
来表示状态变量
xt
上的belief,即下面这个后验概率的缩写:
bel(xt)=p(xt|z1:t,u1:t)
上述后验概率,即状态 xt 的概率分布,以过去所有的测量数据 z1:t 和控制 u1:t 为条件。
读者可能注意到了,我们默默的假设belief是在将测量数据 zt 纳入 以后得到的。有时候,也需要在纳入 zt 以前,刚刚执行完控制行为 ut 时,计算这个后验概率。这样的后验概率,如下式所示:
bel⎯⎯⎯⎯⎯(xt)=p(xt|z1:t−1,u1:t)
上述概率分布在概率滤波的上下文中,经常被称为 预测(prediction)。这个术语反映了一个事实: bel⎯⎯⎯⎯⎯(xt) 在得到时间点 t 的测量值之前,预测了时间点
已更新至:第二章