概率图模型基础(2)——贝叶斯网络中的因果关系

1. 贝叶斯网络

1.1 网络结构

仍然是学生成绩的例子,假设有以下5个随机变量,Grade(G),Course Difficulty(D)、Student Intelligence(I)、Student SAT(S)、Reference Letter(L)。其结构如图example右侧所示。
图1

1.2 贝叶斯网络的表达式

对于无向无环图(DGA)中的每一个节点 X 1 , . . . , X n X_1,...,X_n X1,...,Xn,每一个节点的概率可以写成 P ( X i ∣ P a r G ( X i ) ) P(X_i| Par_G(X_i)) P(XiParG(Xi))
图2.png
在图2中,D,S是两个不相邻的节点,在 G 和 L 未被观测的条件下,D,S在给定I的条件下保持独立。因此有
P ( D , S ) = P ( D ) ( ∑ I P ( I ) P ( S ∣ I ) ) P(D,S)=P(D)(\sum_IP(I)P(S|I)) P(D,S)=P(D)(IP(I)P(SI))

对于上例中的结构,有
P ( D , I , G , S , L ) = P ( D ) P ( I ) P ( G ∣ D , I ) P ( S ∣ I ) P ( L ∣ G ) P(D,I,G,S,L)=P(D)P(I)P(G|D,I)P(S|I)P(L|G) P(D,I,G,S,L)=P(D)P(I)P(GD,I)P(SI)P(LG)

贝叶斯网络中,个节点的概率和为1.image.png

1.3 朴素贝叶斯

假设所有的事例都属于若干两两互斥且是所有事例情况的类中的一个。比如,学生的智商 I I I,存在事例的两个类——高智商和低智商。
除此之外,模型还包括一定数量的、可以观测到其值的特征(features) X 1 , . . . , X n X_1,...,X_n X1,...,Xn。朴素贝叶斯假设(naive Bayes assumption)是在给定事例的类的条件下,这些特征条件独立。

基于上述独立性假设,模型的因子分解可以表示为:
P ( C , X 1 , . . . , X n ) = P ( C ) ∏ i = 1 n P ( X i ∣ C ) P(C,X_1,...,X_n)=P(C) \prod_{i=1}^{n}P(X_i|C) P(C,X1,...,Xn)=P(C)i=1nP(XiC)
朴素贝叶斯模型的贝叶斯网图


2 符号定义

  • ⊨ ⊨ :“满足”
  • ⊥ ⊥ :“独立”

示例1:image.png
上图的意思为:对于事件 α \alpha α β \beta β,若有
P ( α , β ) = P ( α ) P ( β ) P(\alpha, \beta)=P(\alpha)P(\beta) P(α,β)=P(α)P(β)
P ( α ∣ β ) = P ( α ) P(\alpha| \beta)=P(\alpha) P(αβ)=P(α)
P ( β ∣ α ) = P ( β ) P(\beta| \alpha)=P(\beta) P(βα)=P(β)
P P P满足 α \alpha α β \beta β相互独立

示例2:image.png
对于随机变量 X X X Y Y Y,若有
P ( X , Y ) = P ( X ) P ( Y ) P(X, Y)=P(X)P(Y) P(X,Y)=P(X)P(Y)
P ( X ∣ Y ) = P ( X ) P(X| Y)=P(X) P(XY)=P(X)
P ( Y ∣ X ) = P ( Y ) P(Y| X)=P(Y) P(YX)=P(Y)
P P P满足 X X X Y Y Y相互独立


3 因果关系

3.1 具体实例

  1. IntelligenceDifficulty为观测值,GradeLetter为未知值。
    因果关系1
  • 如果Intelligence取较低值,则在此基础上,获得letter的概率下降
  • 如果在此基础上继续减少课程的难度,则 P ( L 1 ∣ i 0 , d 0 ) P(L^1 | i^0,d^0) P(L1i0,d0)的概率会有提升提升。
    表现为:概率从上到下影响。
  1. IntelligenceDifficulty为先验概率值(不是观测值),Grade为观测值。
    执果索因
  • 如果Grade取较低值,则在此基础上,可以推测出,1、智商不够,2、考试很难。
    表现为:概率从下到上影响。
  1. IntelligenceDifficulty为先验概率值(不是观测值),Grade为观测值。
    image.png
  • 如果加上了SAT,对difficultyIntelligence也有很大影响。
    表现为:概率的影响具有传递性。

3.2 贝叶斯网络中各节点如何相互影响?

  1. 直接连接
    XY互连1

XY互连2

在此情况下:Grade改变影响Difficulty,同样的,Difficulty改变也会影响到Grade


  1. 如果W不是观测变量,则X-W-Y可以完成X影响Y。
  • Difficulty->Grade->Letter
    传递性

Grade不为观测变量时,Difficulty可以通过Grade对是否获取Letter进行影响。

  • Letter->Grade->Difficulty
    反向传递

Grade不为观测变量时,Letter的可以通过Grade判断课程的难度。

  • Grade<-Intelligence->SAT

Intelligence不为观测变量时,SAT的可以通过Intelligence判断成绩。


  1. 如果W是观测变量,则如下情况X不会影响Y。
  • Difficulty->Grade->Letter
    传递性

  • Letter->Grade->Difficulty
    反向传递

  • Grade<-Intelligence->SAT


  1. 如果W以及W的子结点没有被观测的话,则X不会影响Y【v-结构】
  • Difficulty->Grade<-Intelligence,其中(Grade和Letter都没有被观测到)

  1. 如果W或W的子结点有被观测的话,则X会影响Y【v-结构】
  • Difficulty->Grade<-Intelligence,或Difficulty->Letter<-Intelligence
    其中(Grade和Letter只要有一个被观测到)

4. 参考课程

Coursera——Probabilistic Graphical Models
PGM课程笔记

  • 3
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
贝叶斯因果推断是一种使用贝叶斯网络(Bayesian Network)进行因果关系推断的方法。贝叶斯网络是一种概率图模型,用于表示变量之间的依赖关系和因果关系。在贝叶斯网络,节点表示变量,边表示变量之间的依赖关系。通过观察节点的状态,可以推断其他节点的状态。 在Python,可以使用PyMC3库来构建贝叶斯网络模型。《Python贝叶斯分析》这本书从实际应用和编写程序的角度解释了贝叶斯统计的关键概念,并介绍了如何使用PyMC3来构建概率模型。这本书不要求读者具备生物学方面的基础知识,但需要读者具备使用Python编写程序的经验\[1\]。 贝叶斯因果推断的一个挑战是数据的结构与贝叶斯网络的独立性不一致。贝叶斯网络的推断算法旨在从概率推断出因果关系,与任何实验无关。因此,贝叶斯网络的推断是基于概率观察数据进行的。此外,贝叶斯网络的推断是从特定前提得出一般性结论,与理论假设的表述无关。这是因为贝叶斯网络的推断是演绎的,而不是从因果假设的表述得出的\[3\]。 因此,Python贝叶斯因果推断可以通过构建贝叶斯网络模型,并使用PyMC3库进行推断。这种方法可以帮助我们从观察数据推断出因果关系,并进行因果推断分析。 #### 引用[.reference_title] - *1* [Python贝叶斯分析 PDF 完整原版](https://blog.csdn.net/weixin_39850143/article/details/110996376)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [数学推导+纯Python实现机器学习算法12:贝叶斯网络](https://blog.csdn.net/weixin_37737254/article/details/102920363)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [贝叶斯因果网络_因果关系贝叶斯网络](https://blog.csdn.net/weixin_26752765/article/details/108132740)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值