前面几讲都专注于上图中Identification的部分,这次介绍Estimation。
1. 条件结果模型(conditional outcome modeling, COM)
回顾一下第二讲中的调整公式,也是第四讲中后门调整的推论,以此来计算ATE τ \tau τ:
τ ≜ E [ Y ( 1 ) − Y ( 0 ) ] = E W [ E [ Y ∣ T = 1 , W ] − E [ Y ∣ T = 0 , W ] ] \tau \triangleq \mathbb{E}[Y(1)-Y(0)]=\mathbb{E}_{W}[\mathbb{E}[Y \mid T=1, W]-\mathbb{E}[Y \mid T=0, W]] τ≜E[Y(1)−Y(0)]=EW[E[Y∣T=1,W]−E[Y∣T=0,W]]
需要注意的是,上式中的W必须是充分调整集。通过这个公式,我们已经将因果量转换为统计量,也就是实现了identifation,下一步要做的就是estimation。
最简单的做法是用统计模型(机器学习模型)拟合条件期望 E [ Y ∣ T , W ] \mathbb{E}[Y \mid T, W] E[Y∣T,W],然后用n个数据点的经验平均值( 1 n ∑ i \frac{1}{n} \sum_{i} n1∑i)去近似 E W \mathbb{E}_{W} EW。
为了表达更清晰,引入 μ \mu μ代替平均期望:
μ ( 1 , w ) − μ ( 0 , w ) ≜ E [ Y ∣ T = 1 , W = w ] − E [ Y ∣ T = 0 , W = w ] \mu(1, w)-\mu(0, w) \triangleq \mathbb{E}[Y \mid T=1, W=w]-\mathbb{E}[Y \mid T=0, W=w] μ(1,w)−μ(0,w)≜E[Y∣T=1,W=w]−E[Y∣T=0,W=w]
然后,我们可以用统计模型拟合 μ \mu μ。 拟合模型中用 μ ^ \hat{\mu} μ^近似 μ \mu μ。我们将模型 μ ^ \hat{\mu} μ^作为条件结果模型。 现在,我们可以清楚地描述我们描述的模型辅助估计器(针对ATE):
τ ^ = 1 n ∑ i ( μ ^ ( 1 , w i ) − μ ^ ( 0 , w i ) ) \hat{\tau}=\frac{1}{n} \sum_{i}\left(\hat{\mu}\left(1, w_{i}\right)-\hat{\mu}\left(0, w_{i}\right)\right) τ^=n1∑i(μ^(1,wi)−μ^(0,wi))
用COM估计条件平均干预效果时,充分调整集是 W ∪ X W \cup X W∪X而非 W W W,因此必须将X作为条件结果模型的一个输入。这时CATE为:
τ ( x ) ≜ E