1.后门准则
定义:给定有向无环图(DAG)中一对有序变量(X,Y),如果变量集合Z(可以为空)满足:
- Z中没有X的后代节点。
- Z阻断了X与Y之间的每条含有指向X的路径。
满足以上两点的Z,就称Z满足关于(X,Y)的后门准则。
如果变量集合Z满足(X,Y)的后门准则,那么X对Y的因果效应可以由下面的公式计算。
证明如下:
一般而言,我们希望节点Z最好可以满足下面这些条件:
- 阻断X和Y之间的所有伪路径(即所有指向X的路径)。
- 保持所有X到Y的有向路径不变。
- 不会产生新的伪路径。(例如condition在collider或者其后代上,可能就会产生一条新的伪路径)。
下面展示一个简单的例子:
根据上述因果图,估计X对Y的因果效应。从图中可以看出,从X到Y有两条路径,第一条是X-M-Y,第二条是X-W-Y。我们想要估计X对Y的因果效应,就应该要阻断第二条路径。根据上面的后门准则,我们可以发现W满足后门准则,所以我们校正W(或者说Condition在W上),就可以得到X对Y的因果效应。前提是W必须是可观测的!
如果W是不可观测的,那么对于W还可以使用后门准则吗?答案是否定的,因为我们无法观测到W,所以无法阻断X-W-Y这条路径,也就无法消除Confounding association,此时association就不是causation.
2.前门准则
定义:如果一个变量集合Z满足以下条件:
- Z切断了所有X到Y的有向路径。
- X到Z没有后门路径。
- 所有Z到Y的后门路径都被X阻断。
则称变量集合Z满足有序变量(X,Y)的前门准则。
如果Z满足变量对(X,Y)的前门准则和Positivity(即),那么X对Y的因果效应是可识别的,且由下式计算:
假设我们有一个这样的因果图:
证明如下:
对于上面的图,即使W是不可观测的,那么我们依然可以使用前门准则,估计X对于Y的因果效应。
但是有些情况,前后门准则都可能无法使用,例如下面这种情况。
因为W1和W2都是无法观测的,无论你使用前门准则还是后门准则,其T对于Y的因果效应总是无法正确估计的。对于这种情况,我们可以使用unconfounded children criterion或者do-calculus来正确估计。这两种方法就不再这里说了,感兴趣的可以自己去看看。
地址为:https://www.bradyneal.com/Introduction_to_Causal_Inference-Dec17_2020-Neal.pdf,在第六章可以看到。