前言
最近在看《概率机器人》这本书,可能这本书太老了,并没有很多参考资料,所以想把所学的难点整理下加深理解。
概率机器人中的所有算法都是基于一个数学基础:贝叶斯滤波。所以搞懂了贝叶斯滤波,也就为看懂这本书奠定了很好的基础。
贝叶斯准则
首先讲讲贝叶斯准则,书里面有一个公式非常重要,但并没有实际的推导过程,这个公式就是:
p
(
x
∣
y
,
z
)
=
p
(
y
∣
x
,
z
)
p
(
x
∣
z
)
p
(
y
∣
z
)
p(x|y, z) = \frac{p(y|x,z)p(x|z)}{p(y|z)}
p(x∣y,z)=p(y∣z)p(y∣x,z)p(x∣z)
这个公式是怎么来的呢?作者省略了中间过程,所以感觉看的一头雾水,那就试着来推导下吧。
不过在这之前,我们先来看一下概率论中 联合概率 和 条件概率
联合概率:x和y同时出现的概率,用数学公式表示就是 p ( x , y ) p(x, y) p(x,y)
条件概率:在y出现的情况下,x出现的概率,用数学公式表示就是 p ( x ∣ y ) p(x|y) p(x∣y)。重要的是它的计算公式 p ( x ∣ y ) = p ( x , y ) p ( y ) p(x|y)= \frac{p(x,y)}{p(y)} p(x∣y)=p(y)p(x,y),这个应该不难理解吧(hhh),为什么重要呢?因为公式左边是条件概率,右边分子是联合概率,所以公式把联合概率和条件概率结合起来了,可以互相计算。也就是我们还可以得到计算联合概率的公式 p ( x , y ) = p ( x ∣ y ) p ( y ) = p ( y ∣ x ) p ( x ) p(x,y) = p(x|y)p(y) = p(y|x)p(x) p(x,y)=p(x∣y)p(y)=p(y∣x)p(x),然后我们就可以得到简单的贝叶斯准则
贝叶斯准则: p ( x ∣ y ) = p ( y ∣ x ) p ( x ) p ( y ) p(x|y) = \frac{p(y|x)p(x)}{p(y)} p(x∣y)=p(y)p(y∣x)p(x)
好了,我们来推导 p ( x ∣ y , z ) = p ( y ∣ x , z ) p ( x ∣ z ) p ( y ∣ z ) p(x|y, z) = \frac{p(y|x,z)p(x|z)}{p(y|z)} p(x∣y,z)=p(y∣z)p(y∣x,z)p(x∣z) 这个公式:
-
公式左边 p ( x ∣ y , z ) p(x|y, z) p(x∣y,z) 表示在y和z发生的情况下,x发生的概率,这是一个条件概率,所以利用条件概率计算公式将 p ( x ∣ y , z ) p(x|y, z) p(x∣y,z) 展开,得到:
p ( x ∣ y , z ) = p ( x , y , z ) p ( y , z ) p(x|y, z) = \frac{p(x,y,z)}{p(y,z)} p(x∣y,z)=p(y,z)p(x,y,z) -
上式右边分子和分母都是联合概率,可以将它们展开为条件概率:
分母为:
p ( x , y , z ) = p ( y ∣ x , z ) p ( x , z ) p(x,y, z) = p(y|x,z)p(x,z) p(x,y,z)=p(y∣x,z)p(x,z)
其中 p ( x , z ) p(x,z) p(x,z) 也是联合概率,可以展开为 p ( x , z ) = p ( x ∣ z ) p ( z ) p(x,z) = p(x|z)p(z) p(x,z)=p(x∣z)p(z)。
所以 p ( x , y , z ) = p ( y ∣ x , z ) p ( x ∣ z ) p ( z ) p(x,y, z) = p(y|x,z)p(x|z)p(z) p(x,y,z)=p(y∣x,z)p(x∣z)p(z)
分子为:
p ( y , z ) = p ( y ∣ z ) p ( z ) p(y,z) = p(y|z)p(z) p(y,z)=p(y∣z)p(z) -
将以上联立起来就可以得到书上的公式:
p ( x ∣ y , z ) = p ( x , y , z ) p ( y , z ) = p ( y ∣ x , z ) p ( x , z ) p ( y ∣ z ) p ( z ) = p ( y ∣ x , z ) p ( x ∣ z ) p ( z ) p ( y ∣ z ) p ( z ) = p ( y ∣ x , z ) p ( x ∣ z ) p ( y ∣ z ) p(x|y, z) = \frac{p(x,y,z)}{p(y,z)} = \frac{p(y|x,z)p(x,z)}{p(y|z)p(z)} = \frac{p(y|x,z)p(x|z)p(z)}{p(y|z)p(z)} = \frac{p(y|x,z)p(x|z)}{p(y|z)} p(x∣y,z)=p(y,z)p(x,y,z)=p(y∣z)p(z)p(y∣x,z)p(x,z)=p(y∣z)p(z)p(y∣x,z)p(x∣z)p(z)=p(y∣z)p(y∣x,z)p(x∣z)
参考
https://zhuanlan.zhihu.com/p/122307317