因果关系基本概念:前门标准

阅读David Salazar的文章Causality: The front-door criterion后的笔记


为什么要前门标准

  在前面的文章中,我们知道,后门标准的作用是隔绝了我们不感兴趣的因果关系,只留下感兴趣的因果路径。但后门标准干涉的变量不一定是可观测的,比如混杂因子(见下图中红色混杂因子Genotype,另外,图中变量 M M M就是下面讲的符合前门标准的变量)。这种情况下,可以使用前门标准(front-door criterion)进行估计。
图片来自所读博客

前门标准应用

  前门标准应用前提是使用前门标准找到能干涉的可观测变量,当变量 M M M满足如下条件,则是符合前门标准的变量(这也是前门标准的应用场景):

  • M M M截断了从 X X X Y Y Y的所有正向路径
  • 没有从 X X X M M M的后门路径(也就是没有变量 Z Z Z同时是 X X X M M M的祖先)
  • 所有从 M M M Y Y Y的后门路径都被 X X X截断了

  用吸烟 X X X对癌症 Y Y Y的影响举个例子,仍然看上图。当加入了观测变量 M M M(肺部焦油量),可以在无法控制基因 U U U的情况下估计吸烟对癌症的影响。前门标准就是把 X → Y X\rightarrow Y XY的作用估计独立为 X → M X\rightarrow M XM M → Y M\rightarrow Y MY两部分,随后合并得到最终结果。影响可以写为式(1)。
P ( Y ∣ d o ( X ) ) = ∑ M P ( Y ∣ M , d o ( X ) ) × P ( M ∣ d o ( X ) ) (1) P(Y|do(X))=\sum_M P(Y|M,do(X))\times P(M|do(X)) \tag{1} P(Ydo(X))=MP(YM,do(X))×P(Mdo(X))(1)
  对子式左半边进行解析。 P ( Y ∣ M , d o ( X ) ) P(Y|M,do(X)) P(YM,do(X))中, M M M只受到 X X X影响,因此无论对 M M M取任何值 Y Y Y的取值分布是不变的。所以, P ( Y ∣ M , d o ( X ) ) = P ( Y ∣ d o ( M ) , d o ( X ) ) P(Y|M,do(X))=P(Y|do(M),do(X)) P(YM,do(X))=P(Ydo(M),do(X))。又由干涉定义, P ( Y ∣ d o ( M ) , d o ( X ) ) = P ( Y ∣ d o ( M ) ) P(Y|do(M),do(X))=P(Y|do(M)) P(Ydo(M),do(X))=P(Ydo(M)),最终可写作式(2)。
P ( Y ∣ M , d o ( X ) ) = P ( Y ∣ d o ( M ) , d o ( X ) ) = P ( Y ∣ d o ( M ) ) (2) P(Y|M,do(X))=P(Y|do(M),do(X))=P(Y|do(M)) \tag{2} P(YM,do(X))=P(Ydo(M),do(X))=P(Ydo(M))(2)
  回到干涉的本质(文章式(4)):对干涉变量的条件变量(父变量)作随机化处理。因此, P ( Y ∣ d o ( M ) ) P(Y|do(M)) P(Ydo(M))可以写作式(3)。
P ( Y ∣ d o ( M ) ) = ∑ M P ( Y ∣ X , M ) × P ( X ) (3) P(Y|do(M))=\sum_M P(Y|X,M)\times P(X) \tag{3} P(Ydo(M))=MP(YX,M)×P(X)(3)
  接下来对子式右半边进行解析。 P ( M ∣ d o ( X ) ) P(M|do(X)) P(Mdo(X))是没有混杂干扰的,因为对撞关系 Y Y Y将间接的因果路径阻断了。因此 P ( M ∣ d o ( X ) ) P(M|do(X)) P(Mdo(X))可写作式(4)。
P ( M ∣ d o ( X ) ) = P ( M ∣ X ) (4) P(M|do(X))=P(M|X) \tag{4} P(Mdo(X))=P(MX)(4)
  最终,我们得到了前门公式(5)。
P ( Y ∣ d o ( X ) ) = ∑ M P ( M ∣ X ) ∑ X ′ P ( Y ∣ M , X ′ ) × P ( X ′ ) ) (5) P(Y|do(X))=\sum_M P(M|X)\sum_{X^{'}}P(Y|M,X^{'})\times P(X^{'})) \tag{5} P(Ydo(X))=MP(MX)XP(YM,X)×P(X))(5)

经验估计

  在回归模型中,我们可以通过前门标准使用平均处理效果(Average Treatment Effect,ATE)来估计因果效应。对应式(1)的两部分,可以写为两个方程(6)和(7)。
Y i = λ + δ M i + ϕ X i + v i (6) Y_i=\lambda +\delta M_i+\phi X_i+v_i \tag{6} Yi=λ+δMi+ϕXi+vi(6)
M i = κ + γ X i + w i (7) M_i=\kappa +\gamma X_i+w_i \tag{7} Mi=κ+γXi+wi(7)
  则平均处理效果的估计为式(8)。
A T E = E [ Y ∣ d o ( X ) ] = δ × γ (8) ATE=E[Y|do(X)]=\delta\times\gamma \tag{8} ATE=E[Ydo(X)]=δ×γ(8)

例子

  不再详述,有兴趣的读者可以移步原文

  • 5
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值