一、核心思想
SCM的核心思想是因果图,因果图之前已经介绍过,SCM和RCM是等价的。
SCM的关键在于图模型,来源于贝叶斯网络,将Bayes网络加上外部干预,用来定义外部干预的因果作用和描述多个变量之间的因果关系,利用因果网络不仅能定量评价因果作用,还能定性确定混杂因素,用于从数据挖掘因果关系
二、结构方程
结构因果模型中的一个重要概念是结构方程 (structural equations
),其假设每个节点xi都对应一个未观测到的外生变量ui(exogenous variable,或者叫做遗漏因子),节点的值由该遗漏因子ui及父代变量pai通过一个方程来唯一确定,遗漏因子会造成扰动(误差),它可能是未知 or/and 随机的,我们并不关心它们变化的原因。
这个方程为:
结构方程和因果图的对应关系如下图所示。
![](https://img-blog.csdnimg.cn/2acea34ec60e4c08bd2fa5334f585c2b.png)
![](https://img-blog.csdnimg.cn/ae318ad97557409796de733c1dfda4f1.png)
与代数方程不同,结构方程其代表 变量的生成机制,只能由等式右边对左边赋值,而不能随意变换方向。外生变量描述的是对应节点变量的所有随机因素,其自身具有确定性的概率分布,通常 未被观测也无法进行控制,而且 SCM 中假设所有外生变量之间相互独立。
三、SCM基本概念
SCM就是加入do算子,前文已经介绍过。
根据do操作,变可以定义因果效应,比如二值得Z对于Y的平均因果效应定义为:
上面do操作下的期望,分别对应do操作下的分布。
四、d分离
前文已经介绍过
五、前门法则和后门法则
六、因果模型中的概率预测
已知一个函数因果模型(如下式),如果我们从pai的每个成员画一个指向Xi的箭头,那么得到的图G称为因果图。如果因果图是无欢的,那么对应的模型称为半马尔科夫模型,变量X的值由变量U的值唯一决定。在这样的条件下,联合分布P(x1,x2,...,xn)由误差变量的分布P(u)唯一决定。如果除了无环以外,误差项是联合独立的,那么该模型称为马尔科夫模型。
七、函数模型中的反事实
反事实语句不能在随机因果网络的框架下定义。