版权:转载前请联系作者获得授权。
参考书籍:《The Book of Why》——Judea Pearl、论文
基础知识
对于下面的因果图,
M
M
M是
X
X
X和
Y
Y
Y之间的中介。
直接效应:扰动 X X X而保持 M M M恒定时,对 Y Y Y的影响即为直接效应。
间接效应:保持 X X X恒定,并将 M M M增加到 X X X增加1个单位的情况下 M M M所能达到的量,此时 Y Y Y的增量即为 X X X对 Y Y Y的间接效应。
受控直接效应:
C
D
E
(
0
)
=
P
(
Y
=
1
∣
d
o
(
X
=
1
)
,
d
o
(
M
=
0
)
)
−
P
(
Y
=
1
∣
d
o
(
X
=
0
)
,
d
o
(
M
=
0
)
)
CDE(0) = P(Y=1 | do(X=1), do(M=0)) - P(Y=1 | do(X=0),do(M=0))
CDE(0)=P(Y=1∣do(X=1),do(M=0))−P(Y=1∣do(X=0),do(M=0))
其中,“受控”指的是受中介物
M
M
M的控制,
C
D
E
(
0
)
CDE(0)
CDE(0)即为强迫中介物
M
=
0
M=0
M=0。通过控制中介物
M
=
0
M=0
M=0可以关闭间接路径,从而得到直接效应。
但是,通过受控直接效应去估计直接效应会陷入“过度对照实验”陷阱。由于中介物的取值并不是只有0,所以,存在多个受控直接效应: C D E ( 0 ) , C D E ( 1 ) , . . . , C D E ( N ) CDE(0), CDE(1), ... , CDE(N) CDE(0),CDE(1),...,CDE(N),使用哪一个受控直接效应更合适呢?对于这个问题,可以使用自然直接效应解决。
自然直接效应: N D E = P ( Y M = M 0 = 1 ∣ d o ( X = 1 ) ) − P ( Y M = M 0 = 1 ∣ d o ( X = 0 ) ) NDE = P(Y_{M=M_0}=1 | do(X=1)) - P(Y_{M=M_0}=1 | do(X=0)) NDE=P(YM=M0=1∣do(X=1))−P(YM=M0=1∣do(X=0))
从公式中可以看出,自然直接效应中不以中介物 M M M为条件,而是通过反事实进行定义。
受控间接效应:由于无法通过控制某些变量恒定来关闭直接路径,故不存在受控间接效应。
自然间接效应: N I E = P ( Y M = M 1 = 1 ∣ d o ( X = 0 ) ) − P ( Y M = M 0 = 1 ∣ d o ( X = 0 ) ) NIE = P(Y_{M=M_1}=1|do(X=0)) - P(Y_{M=M_0}=1|do(X=0)) NIE=P(YM=M1=1∣do(X=0))−P(YM=M0=1∣do(X=0))
总效应: T E ( X = 0 → X = 1 ) = N D E ( X = 0 → X = 1 ) − N I E ( X = 1 → X = 0 ) TE(X=0 \rightarrow X=1) = NDE(X=0 \rightarrow X=1) - NIE(X=1 \rightarrow X=0) TE(X=0→X=1)=NDE(X=0→X=1)−NIE(X=1→X=0)
中介公式
共分为两条,可直接通过数据中的统计信息计算 N D E NDE NDE和 N I E NIE NIE。 N D E NDE NDE的公式出自论文, E E E代表数学期望。 N I E NIE NIE的公式出自《为什么》一书。
N D E = ∑ m [ E ( Y ∣ X = 1 , M = m ) − E ( Y ∣ X = 0 , M = m ) ] × P ( M = m ∣ X = 0 ) NDE = \sum_m [E(Y|X=1, M=m) - E(Y|X=0, M=m)] \times P(M=m|X=0) NDE=∑m[E(Y∣X=1,M=m)−E(Y∣X=0,M=m)]×P(M=m∣X=0)
N I E = ∑ m [ P ( M = m ∣ X = 1 ) − P ( M = m ∣ X = 0 ) ] × P ( Y = 1 ∣ X = 0 , M = m ) NIE=\sum_m[P(M=m|X=1) - P(M=m|X=0)] \times P(Y=1|X=0,M=m) NIE=∑m[P(M=m∣X=1)−P(M=m∣X=0)]×P(Y=1∣X=0,M=m)