概率图模型的d-separation概念



d-separation

三种类型:

  1. Serial connection (head-to-tail)
  2. Diverging connection (tail-to-tail)
  3. Converging connection

公式推导


链式法则

P ( X 1 , X 2 , . . . , X n ) = P ( X 1 ∣ X 2 , . . . , X n ) P ( X 2 ∣ X 3 , . . . , X n ) . . . P ( X n − 1 ∣ X n ) P ( X n ) P(X_1,X_2,...,X_n)=P(X_1|X_2,...,X_n)P(X_2|X_3,...,X_n)...P(X_{n-1}|X_n)P(X_n) P(X1,X2,...,Xn)=P(X1X2,...,Xn)P(X2X3,...,Xn)...P(Xn1Xn)P(Xn)

贝叶斯网络定义:
P ( X 1 , X 2 , . . . , X n ) = ∏ i = 1 n P ( X i ∣ P A ( X i ) ) P(X_1,X_2,...,X_n)=\prod^n_{i=1}P(X_i|PA(X_i)) P(X1,X2,...,Xn)=i=1nP(XiPA(Xi))
在这里插入图片描述


Serial connection (head-to-tail)

在这里插入图片描述

不观测 X k X_k Xk

P ( X i , X j ) = ∑ x k P ( X i , X j , X k ) = P ( X i ) P ( X j ∣ X i ) P(X_i,X_j)=\sum_{x_k}P(X_i,X_j,X_k)=P(X_i)P(X_j|X_i) P(Xi,Xj)=xkP(Xi,Xj,Xk)=P(Xi)P(XjXi)

结果:X与Y并不是独立事件

观测 X k X_k Xk

P ( X i , X k , X j ) = P ( X i ) P ( X k ∣ X i ) P ( X j ∣ X k ) P(X_i,X_k,X_j)=P(X_i)P(X_k|X_i)P(X_j|X_k) P(Xi,Xk,Xj)=P(Xi)P(XkXi)P(XjXk)

P ( X i , X j ∣ X k ) = P ( X i , X k , X j ) P ( X k ) = P ( X i ) P ( X k ∣ X i ) P ( X j ∣ X k ) P ( X k ) = P ( X i , X j ) P ( X j ∣ X k ) P ( X k ) = P ( X i ∣ X k ) P ( X j ∣ X k ) P(X_i,X_j|X_k)=\frac{P(X_i,X_k,X_j)}{P(X_k)} =\frac{P(X_i)P(X_k|X_i)P(X_j|X_k)}{P(X_k)}=\frac{P(X_i,X_j)P(X_j|X_k)}{P(X_k)}=P(X_i|X_k)P(X_j|X_k) P(Xi,XjXk)=P(Xk)P(Xi,Xk,Xj)=P(Xk)P(Xi)P(XkXi)P(XjXk)=P(Xk)P(Xi,Xj)P(XjXk)=P(XiXk)P(XjXk)

结果: X i , X j X_i,X_j Xi,Xj关于 X k X_k Xk条件独立


Diverging connection (tail-to-tail)

在这里插入图片描述

不观测 X k X_k Xk

P ( X i , X j ) = ∑ x k P ( X i , X j , X k ) = ∑ x k P ( X k ) P ( X j ∣ X k ) P ( X i ∣ X k ) P(X_i,X_j)=\sum_{x_k}P(X_i,X_j,X_k)=\sum_{x_k}P(X_k)P(X_j|X_k)P(X_i|X_k) P(Xi,Xj)=xkP(Xi,Xj,Xk)=xkP(Xk)P(XjXk)P(XiXk)

结果:X与Y并不是独立事件

观测 X k X_k Xk

P ( X i , X k , X j ) = P ( X k ) P ( X i ∣ X k ) P ( X j ∣ X k ) P(X_i,X_k,X_j)=P(X_k)P(X_i|X_k)P(X_j|X_k) P(Xi,Xk,Xj)=P(Xk)P(XiXk)P(XjXk)
P ( X i , X j ∣ X k ) = P ( X i , X k , X j ) P ( X k ) = P ( X k ) P ( X i ∣ X k ) P ( X j ∣ X k ) P ( X k ) = = P ( X i ∣ X k ) P ( X j ∣ X k ) P(X_i,X_j|X_k)=\frac{P(X_i,X_k,X_j)}{P(X_k)} =\frac{P(X_k)P(X_i|X_k)P(X_j|X_k)}{P(X_k)}==P(X_i|X_k)P(X_j|X_k) P(Xi,XjXk)=P(Xk)P(Xi,Xk,Xj)=P(Xk)P(Xk)P(XiXk)P(XjXk)==P(XiXk)P(XjXk)

结果: X i , X j X_i,X_j Xi,Xj关于 X k X_k Xk条件独立


Converging connection

在这里插入图片描述

不观测 X k X_k Xk

P ( X i , X j ) = ∑ x k P ( X i , X j , X k ) = P ( X i ) P ( X j ) ∑ x k P ( X k ) = P ( X i ) P ( X j ) P(X_i,X_j)=\sum_{x_k}P(X_i,X_j,X_k)=P(X_i)P(X_j)\sum_{x_k}P(X_k)=P(X_i)P(X_j) P(Xi,Xj)=xkP(Xi,Xj,Xk)=P(Xi)P(Xj)xkP(Xk)=P(Xi)P(Xj)

结果:X与Y是独立事件

观测 X k X_k Xk

P ( X i , X j ∣ X k ) = P ( X i , X k , X j ) P ( X k ) = P ( X i ) P ( X j ) P ( X k ∣ X i , X j ) P ( X k ) P(X_i,X_j|X_k)=\frac{P(X_i,X_k,X_j)}{P(X_k)} =\frac{P(X_i)P(X_j)P(X_k|X_i,X_j)}{P(X_k)} P(Xi,XjXk)=P(Xk)P(Xi,Xk,Xj)=P(Xk)P(Xi)P(Xj)P(XkXi,Xj)

结果: X i , X j X_i,X_j Xi,Xj关于 X k X_k Xk 不是 条件独立

定义

在不同的已知条件下判断A,B是否属于D-Separationd时会得到不同的结果。
比如已知了C下可能判断出A 和B是d分离的,
但如果不知道c或者已知为节点D的状态或者不知道任何其他节点的状态,则可能得出的结果是A,B未分离的。

定义 D-Separation: 对于 DAG 图 E,且A,B是图中的两个节点,对于A和B之间的每个结点C,如果节点C满足如下两个条件之一,则认为A,B是D-Separationd:

  • the connection of C is serial or diverging and the state of C is observed;
  • the connection of C is converging and neither the state of C nor the state of any descendant of C is observed

简单的来说:在C可观测时候 且 C是 serial 或者 diverging 连接时候,A,B是d分离的(独立);在C不可观测时候 且 C是 converging 连接时候,A,B是d分离的(独立)
反之:在C 可观测时候 且 C是 serial 或者 diverging 连接时候,A,B不是d分离的(独立);在C 可观测时候 且 C是 converging 连接时候,A,B 不是 d分离的(独立)

参考

参考_d-seperation_知乎
参考_d-seperation_博客园
参考_d-seperation_CSDN

  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值