在很多情况下,我们感兴趣的是某个事件,在给定其他事件发生时出现的概率。这种概率叫做条件概率。我们将给定
x=x,y=y
发生的条件概率记为
P(y=y|x=x)
。这个条件概率可以通过下面的公式计算:
P(y=y|x=x)=P(y=y,x=x)P(x=x)
条件概率只在 P(x=x)>0 时有定义。我们不能计算给定在永远不会发生的事件上的条件概率。
条件概率的链式法则
任何多维随机变量的联合概率分布,都可以分解成只有一个变量的条件概率相乘的形式:
P(x(1),...,x(n))=P(x(1))∏i=2nP(x(i)|x(1),...,x(i−1))
这个规则被称为概率的链式法则或者乘法法则,它可以直接从条件概率的定义求得。例如:
P(a,b,c)=P(a|b,c)P(b,c)P(b,c)=P(b|c)P(c)P(a,b,c)=P(a|b,c)P(b|c)P(c)
独立性和条件独立性
两个随机变量
x
和
y
,如果它们的概率分布可以表示成两个因子的乘积形式,并且一个因子只包含
x
另一个因子只包含
y
,我们就称这两个随机变量是相互独立的
∀x∈x,y∈y,p(x=x,y=y)=p(x=x)p(y=y)
如果关于 x 和 y 的条件概率分布对于 z 的每一个值都可以写成乘积的形式,那么这个两个随机变量
我们可以采用一种简化形式来表示独立性和条件独立性: x⊥y 表示 x 和 y 相互独立, x⊥y|z 表示 x 和 y 在给定 z 时条件独立。