第三章:关联和因果关系在图中的流动

目录

1、Graph terminology 图的基本术语

2、Batesian networks and casual graphs 贝叶斯网络和因果图

3、The basic building blocks of graphs 图的基本构建模块

4、The flow of association and causation 关联和因果关系的流动

总结

1、Graph terminology 图的基本术语

 

 

 

 

2、Batesian networks and casual graphs 贝叶斯网络和因果图

在因果图中我们主要研究有向无环图DAG。 而如果给定这样一个有向无环图,我们想求有向无环图中的分布关系,我们就需要先定义有向无环图对应的分布情况。

Bayesian Networks 贝叶斯网络,一个概率图模型,因果图就是根据它产生的,因此先介绍它,贝叶斯网络的职责是将概率和图模型结合起来,使得我们能直接利用图表示概率关系,而想用图模型来表示概率关系,需要先提出两个假设。

我们先不谈因果,来看一个统计模型:联合分布分解,条件概率的乘法定理/链式法则:

假设n = 4,x取值是二进制,得到如下图所示。 因此先提出一个最基础的假设: DAG中相邻的点是依赖关系。 但这样每加一个变量,参数数量就会指数级上升, 如下图所示。 因此光是一个依赖假设还是不够,我们需要 引入独立假设,进行简化,减少不必要的计算量。

 附:乘法定理证明:

 假设一:局部马尔可夫假设

则贝叶斯网络分解的公式如下:

 

由此可知,贝叶斯网络分解和局部马尔可夫假设是等价的(充要条件)

 假设二:最小假设

 

到目前为止,我们可以得到如下流程图: 

 

理论上,知道这两个假设就可以求出所有的因果关系,但在实际中,当因果关系复杂起来 就很难分析,因此我们需要构建一些基本的块block。 

3、The basic building blocks of graphs 图的基本构建模块

 当我们同时将X2作为条件, Chain 和 Fork 就拥有相同的独立关系,X1和X3的关联被X2 blocked(阻断了),X1和X3就会变成相互独立的两个节点。证明如下图,我们得到了:给定X2时,X1和X3的联合概率等于他们各自的概率相乘。

 用条件概率公式可以得到上面计算过程 

 

(collider是对撞结构,也就是immorality不道德结构 )

附:什么是边缘化?

边缘化是一种方法,它要求对一个变量的可能值求和,以确定另一个变量的边缘贡献。边缘化告诉我们只要把一些变量累加起来就可以得到所需概率量。

具体可以看一篇blog:(26条消息) 概率论入门:边缘化_Lemonbr的博客-CSDN博客_边缘化概率

4、The flow of association and causation 关联和因果关系的流动

但当以X2为条件的时候,X1和X3就不独立了。

用一个例子说明当以X2为条件时,X1和X3不独立:

节点 X1与节点 X3 以共同效应 X2 作为条件时,这两个独立变量为什么就变得相互依赖了呢?

这是因为,当我们以 X2 作为条件时,我们限定了 X2 取相同值时的情况。由于 X2 的值依赖于 X1 和 X3,因此 X1 值的任何变化必须通过 X3 值的变化来补偿,否则 X2 值也会改变。

举一个例子:X2 = X1 + X3,且 X1 和 X3 是独立的变量,有以下推理:如果已知 X1 = 1,我们无法得知有关于 X3 可能值的任何信息,因为两个变量时独立的;但倘若已知 X2 = 3,那么再告知我 X1 = 1 时,我就立马能够确认 X3 只能是 2,即给定 X2 = 3 的条件下,X1 与 X3 是相互依赖的。

最后,我们还可以根据Immorality/collider的性质延伸出一种情况,如下图所示,如果我们以x2的子孙X4为条件,也会产生关联,这个关联流向为x4->x2->(x1,x3)。

 

d-separation:

基于blocked path,我们定义d-separation: 如果X(中的任何节点)和Y(中的任何节点)之间的所有路径都被Z阻塞,则两(组)节点X和Y被一组节点Z 分隔。 给定p满足关于图G的马尔可夫假设,如果在Z条件下,X和Y在G中是 d-separation 的,则在Z条件下,X和Y在分布P中是条件独立的。 

我们称之为全局马尔可夫假设。

local Markov assumption,global Markov assumption 和 Bayesian network factorization是不同角度的理解,他们三者是完全等价的 对于一个DAG(有向无环图),d-separation方法可以快速的判断出两个节点之间是否是条件独立的。

总结

这一章我们详细探讨了因果图中点与点之间关系,并学习了如何分辨关系以及使其独立的方法。但在因果推理中,我们希望得到的是因果关系,而不是独立关系,这需要一些方法能够抛开非因果关联,只留下因果关联,如上图所示,只考虑蓝色线(T是Y的因,看箭头方向)。然后计算因果效应。也就是屏蔽掉混淆关系。association≠causation。

ps:刚入门因果推断,有什么错误欢迎批评指正,也欢迎对这一方向感兴趣的大家一起交流,学习进步。

参考:

(26条消息) 因果推理(三):关联和因果在因果图中的流动_一千克欣喜的博客-CSDN博客

《因果推理导论》课程(2020) by Brady Neal_哔哩哔哩_bilibili

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值