多随机变量之间的关系

例子


假设 概率王国 有三个县(A县、B县、C县),面积分布为 P ( A ) 、 P ( B ) 、 P ( C ) P(A)、P(B)、P(C) P(A)P(B)P(C);这个国家的土地使用性质分为三类:住宅、工厂和农田,它们的面积分别为: P ( 住 宅 ) 、 P ( 工 厂 ) 、 P ( 农 田 ) P(住宅)、P(工厂)、P(农田) P()P()P()这些面积的和就是整个国家的面积:
P ( A ) + P ( B ) + P ( C ) = 1 P ( 住 宅 ) + P ( 工 厂 ) + P ( 农 田 ) = 1 \begin{array}{l} {P(A) + P(B) + P(C) = 1} \\ {P(住宅) + P(工厂) + P(农田) = 1} \end{array} P(A)+P(B)+P(C)=1P()+P()+P()=1

实例图

由以上所知,我们定义如下信息:

  • P ( A ) P(A) P(A):A 县的全体面积; P ( B ) P(B) P(B):B 县的全体面积; P ( C ) P(C) P(C):C 县的全体面积;
  • P ( 住 宅 ) P(住宅) P():全国的住宅面积; P ( 工 厂 ) P(工厂) P():全国的工厂面积; P ( 农 田 ) P(农田) P():全国的农田面积;
  • P ( A , 住 宅 ) P(A,住宅) P(A):A 县的住宅面积; P ( A , 工 厂 ) P(A,工厂) P(A):A 的工厂面积; P ( A , 农 田 ) P(A,农田) P(A):A 的农田面积;
  • P ( B , 住 宅 ) , P ( B , 工 厂 ) , P ( B , 农 田 ) ; P ( C , 住 宅 ) , P ( C , 工 厂 ) , P ( C , 农 田 ) P(B, 住宅), P(B, 工厂), P(B, 农田); P(C, 住宅), P(C, 工厂), P(C, 农田) P(B,),P(B,),P(B,);P(C,),P(C,),P(C,) 含义类似;

我们定义随机变量 X X X,它的取值范围为: A , B , C {A, B, C} A,B,C;定义随机变量 Y Y Y,它的取值范围为: 住 宅 、 工 厂 、 农 田 住宅、工厂、农田


联合概率和条件概率


我们定义形如 P ( X = a , Y = b ) P(X=a, Y=b) P(X=a,Y=b),这类包含多个条件且所有条件同时成立的概率为 联合概率
形如 P ( X = a ) P(X = a) P(X=a) 或者 P(Y = b) 这类仅单个随机变量的概率为 边缘概率
联合概率边缘概率 具有如下关系:

P ( X = a ) = ∑ b P ( X = a , Y = b ) P ( Y = b ) = ∑ a P ( X = a , Y = b ) \begin{array}{l} {P(X = a) = \sum_{b} {P(X = a, Y = b)}} \\ {P(Y = b) = \sum_{a} {P(X = a, Y = b)}} \end{array} P(X=a)=bP(X=a,Y=b)P(Y=b)=aP(X=a,Y=b)

全国的住宅、工厂、农田面积可以如此得到:
P ( Y = 住 宅 ) = P ( X = A , Y = 住 宅 ) + P ( X = B , Y = 住 宅 ) + P ( X = C , Y = 住 宅 ) P ( Y = 工 厂 ) = P ( X = A , Y = 工 厂 ) + P ( X = B , Y = 工 厂 ) + P ( X = C , Y = 工 厂 ) P ( Y = 农 田 ) = P ( X = A , Y = 农 田 ) + P ( X = B , Y = 农 田 ) + P ( X = C , Y = 农 田 ) \begin{array}{l} {P(Y = 住宅) = P(X = A, Y = 住宅) + P(X = B, Y = 住宅) + P(X = C, Y = 住宅)} \\ {P(Y = 工厂) = P(X = A, Y = 工厂) + P(X = B, Y = 工厂) + P(X = C, Y = 工厂)} \\ {P(Y = 农田) = P(X = A, Y = 农田) + P(X = B, Y = 农田) + P(X = C, Y = 农田)} \end{array} P(Y=)=P(X=A,Y=)+P(X=B,Y=)+P(X=C,Y=)P(Y=)=P(X=A,Y=)+P(X=B,Y=)+P(X=C,Y=)P(Y=)=P(X=A,Y=)+P(X=B,Y=)+P(X=C,Y=)


A、B、C三县的面积可以如下得到:
P ( X = A ) = P ( X = A , Y = 住 宅 ) + P ( X = A , Y = 工 厂 ) + P ( X = A , Y = 农 田 ) P ( X = B ) = P ( X = B , Y = 住 宅 ) + P ( X = B , Y = 工 厂 ) + P ( X = B , Y = 农 田 ) P ( X = C ) = P ( X = C , Y = 住 宅 ) + P ( X = C , Y = 工 厂 ) + P ( X = C , Y = 农 田 ) \begin{array}{l} {P( X = A) = P(X = A, Y = 住宅) + P(X = A, Y = 工厂) + P(X = A, Y = 农田)} \\ {P(X = B) = P(X = B, Y = 住宅) + P(X = B, Y = 工厂) + P(X = B, Y = 农田)} \\ {P(X = C) = P(X = C, Y = 住宅) + P(X = C, Y = 工厂) + P(X = C, Y = 农田)} \end{array} P(X=A)=P(X=A,Y=)+P(X=A,Y=)+P(X=A,Y=)P(X=B)=P(X=B,Y=)+P(X=B,Y=)+P(X=B,Y=)P(X=C)=P(X=C,Y=)+P(X=C,Y=)+P(X=C,Y=)


全国的总面积可以如此得到:
P ( X = A , Y = 住 宅 ) + P ( X = A , Y = 工 厂 ) + P ( X = A , Y = 农 田 ) + P ( X = B , Y = 住 宅 ) + P ( X = B , Y = 工 厂 ) + P ( X = B , Y = 农 田 ) + P ( X = C , Y = 住 宅 ) + P ( X = C , Y = 工 厂 ) + P ( X = C , Y = 农 田 ) = 1 \begin{array}{l} {P(X = A, Y = 住宅) + P(X = A, Y = 工厂) + P(X = A, Y = 农田)} \\ {+ P(X = B, Y = 住宅) + P(X = B, Y = 工厂) + P(X = B, Y = 农田)} \\ {+ P(X = C, Y = 住宅) + P(X = C, Y = 工厂) + P(X = C, Y = 农田)} \\ {= 1} \end{array} P(X=A,Y=)+P(X=A,Y=)+P(X=A,Y=)+P(X=B,Y=)+P(X=B,Y=)+P(X=B,Y=)+P(X=C,Y=)+P(X=C,Y=)+P(X=C,Y=)=1


条件概率


形如 P ( Y = b ∣ X = a ) P(Y = b | X = a) P(Y=bX=a) 这种表达式的含义为:在事件 X = a X=a X=a 发生的前提下,事件 Y = b Y = b Y=b 的概率,我们称这样的概率为 条件概率
条件概率的定义如下:
P ( Y = b ∣ X = a ) = P ( X = a , Y = b ) P ( X = a ) P(Y = b | X = a) = \frac{P(X = a,Y = b)}{P(X = a)} P(Y=bX=a)=P(X=a)P(X=aY=b)

条件概率具有如下形式:
穷 尽 Y 的 取 值 之 后 , 有 ∑ b P ( Y = b ∣ X = a ) = 1 ( 这 个 1 表 示 的 是 比 例 ) ; 穷尽 Y 的取值之后,有 \sum_{b} P(Y = b | X = a) = 1(这个1表示的是比例); YbP(Y=bX=a)=11;

例如,我们想知道 A 县中,住宅、工厂、农田所站的比重,可以有如下计算:
P ( Y = 住 宅 ∣ X = A ) = P ( X = A , Y = 住 宅 ) P ( X = A ) P ( Y = 工 厂 ∣ X = A ) = P ( X = A , Y = 工 厂 ) P ( X = A ) P ( Y = 农 田 ∣ X = A ) = P ( X = A , Y = 农 田 ) P ( X = A ) \begin{array}{l} {P(Y = 住宅 | X = A) = \frac{P(X = A,Y = 住宅)}{P(X = A)}} \\ {P(Y = 工厂 | X = A) = \frac{P(X = A,Y = 工厂)}{P(X = A)}} \\ {P(Y = 农田 | X = A) = \frac{P(X = A,Y = 农田)}{P(X = A)}} \end{array} P(Y=X=A)=P(X=A)P(X=AY=)P(Y=X=A)=P(X=A)P(X=AY=)P(Y=X=A)=P(X=A)P(X=AY=)


贝叶斯公式:


假设我们得到以下信息:

  • 各县的面积为: P ( A ) = 0.2 P(A) = 0.2 P(A)=0.2 P ( B ) = 0.32 P(B) = 0.32 P(B)=0.32 P ( C ) = 0.48 P(C) = 0.48 P(C)=0.48;
  • A 县的详情为: P ( 住 宅 ∣ A ) = 0.2 P(住宅|A) = 0.2 P(A)=0.2 P ( 工 厂 ∣ A ) = 0.6 P(工厂|A) = 0.6 P(A)=0.6 P ( 农 田 ∣ A ) = 0.2 P(农田|A) = 0.2 P(A)=0.2
  • B 县的详情为: P ( 住 宅 ∣ B ) = 0.5 P(住宅|B) = 0.5 P(B)=0.5 P ( 工 厂 ∣ B ) = 0.25 P(工厂|B) = 0.25 P(B)=0.25 P ( 农 田 ∣ B ) = 0.25 P(农田|B) = 0.25 P(B)=0.25
  • C 县的详情为: P ( 住 宅 ∣ C ) = 0.25 P(住宅|C) = 0.25 P(C)=0.25 P ( 工 厂 ∣ C ) = 0.25 P(工厂|C) = 0.25 P(C)=0.25 P ( 农 田 ∣ C ) = 0.5 P(农田|C) = 0.5 P(C)=0.5
  • 求此时 P(A|工厂)是多少?可以理解为:A县工厂的面积占全国工厂总面积的比例?

这个问题可以抽象为:我们由一组 P ( 县 ) P(县) P() P ( 用 途 ∣ 县 ) P(用途|县) P() 构成的关系式推导出 P ( 县 ∣ 用 途 ) P(县|用途) P()?
我们的求解可以用 A县的工厂面积 除以 全国工厂总面积
P ( A ∣ 工 厂 ) = P ( A , 工 厂 ) P ( 工 厂 ) P(A | 工厂) = \frac{P(A,工厂)}{P(工厂)} P(A)=P()P(A)

其中,分子 P ( A , 工 厂 ) P(A, 工厂) P(A,) 可以由:
P ( A , 工 厂 ) = P ( 工 厂 ∣ A ) P ( A ) P(A,工厂) = P(工厂|A)P(A) P(A)=P(A)P(A)
得到


分母 P ( 工 厂 ) P(工厂) P() 可以由:
P ( 工 厂 ) = P ( A , 工 厂 ) + P ( B , 工 厂 ) + P ( C , 工 厂 ) = P ( 工 厂 ∣ A ) P ( A ) + P ( 工 厂 ∣ B ) P ( B ) + P ( 工 厂 ∣ C ) P ( C ) \begin{aligned} P(工厂) &= P(A,工厂) + P(B, 工厂) + P(C, 工厂) \\ &= P(工厂|A)P(A) + P(工厂|B)P(B) + P(工厂|C)P(C) \end{aligned} P()=P(A)+P(B,)+P(C,)=P(A)P(A)+P(B)P(B)+P(C)P(C)


所以最终,表达式如下:
P ( A ∣ 工 厂 ) = P ( A , 工 厂 ) P ( 工 厂 ) = P ( 工 厂 ∣ A ) P ( A ) P ( A , 工 厂 ) + P ( B , 工 厂 ) + P ( C , 工 厂 ) = P ( 工 厂 ∣ A ) P ( A ) P ( 工 厂 ∣ A ) P ( A ) + P ( 工 厂 ∣ B ) P ( B ) + P ( 工 厂 ∣ C ) P ( C ) \begin{aligned} P(A | 工厂) &= \frac{P(A,工厂)}{P(工厂)} \\ &= \frac{P(工厂|A)P(A)}{P(A,工厂) + P(B, 工厂) + P(C, 工厂)} \\ &= \frac{P(工厂|A)P(A)}{P(工厂|A)P(A) + P(工厂|B)P(B) + P(工厂|C)P(C)} \end{aligned} P(A)=P()P(A)=P(A)+P(B,)+P(C,)P(A)P(A)=P(A)P(A)+P(B)P(B)+P(C)P(C)P(A)P(A)

由上述式子可以得到关于贝叶斯公式的概念:
已知 P ( X = [ A , B , C ] ) P(X = [ A, B, C]) P(X=[A,B,C]) 和 P(Y = [住宅、工厂、农田] | X = [A, B, C]),要求 P ( X = A ∣ Y = 工 厂 ) P(X = A | Y = 工厂) P(X=AY=) ? 其公式可以如下:
P ( X = A ∣ Y = 工 厂 ) = P ( X = A , Y = 工 厂 ) P ( Y = 工 厂 ) = P ( Y = 工 厂 ∣ X = A ) P ( X = A ) ∑ X = [ A , B , C ] P ( X , Y = 工 厂 ) = P ( Y = 工 厂 ∣ X = A ) P ( X = A ) ∑ X = [ A , B , C ] P ( Y = 工 厂 ∣ X ) P ( X ) \begin{aligned} P(X = A | Y = 工厂) &= \frac{P(X = A,Y = 工厂)}{P(Y = 工厂)} \\ &= \frac{P(Y= 工厂 | X = A)P(X = A)}{\sum_{X = [A,B,C]} P(X, Y = 工厂) } \\ &= \frac{P(Y= 工厂 | X = A)P(X = A)}{\sum_{X = [A,B,C]} P(Y = 工厂|X)P(X) } \end{aligned} P(X=AY=)=P(Y=)P(X=AY=)=X=[ABC]P(X,Y=)P(Y=X=A)P(X=A)=X=[ABC]P(Y=X)P(X)P(Y=X=A)P(X=A)

上述公式被称为 贝叶斯公式


独立性


假设存在多个事件A 和 B,独立性是指:事件 A 发生与否与事件 B 发生与否毫无关联,此时可以称事件A 和 B 相互独立;
相互独立的事件 A 和 B 具有如下性质:

  • 条件概率与条件无关: P ( X = a ∣ Y = b ) = P ( X = a ) P(X = a | Y = b) = P(X = a) P(X=aY=b)=P(X=a) 与 Y 无关;
  • 联合概率是边缘概率的乘积: P ( X = a , Y = b ) = P ( X = a ) P ( Y = b ) P(X =a , Y = b) = P(X = a)P(Y = b) P(X=a,Y=b)=P(X=a)P(Y=b);
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值