ATE(average treatment effect)和ATT(average treatment effect for the treated group)是了解causal inference绕不开的两个概念,但这两个概念看上去非常相似,大部分中的文献定义有些抽象。所以我在这里尝试分享下我的理解,但我的目标并不是成为一个理论研究者,所以解释可能会不严谨,仅供参考。
首先说下TE(treatment effect)的概念:对于一个人Peter(subject),如果他在平行宇宙(所有其他条件完全相同)的两个时间线,一个吃了药(treated),一个没吃药(untreated),导致了一个时间线的中他的血压(outcome)是120,另一个是180,那么我们可以说这个药在这个subject上的TE就是120-180=60。
那么如果我们研究的目标是人类,而不是Peter,我们就需要求出所有人的TE,然后取平均,这就得到了ATE。
下面回到现实,我们无法知道平行宇宙另一端的事情,所以我们只能列举出所有导致血压变化的因素(confounders),然后找到这些因素与Peter都相同的人(这个过程称为matching),假如Peter吃了药,而这个人没吃,那么我们用Peter的血压减去这个人的血压就得到了ATT,为什么是ATT呢,因为我们是依据吃了药的Peter来确定confounders,进而通过confounders来找控制样本(control group)。换句话说,ATE要考虑所有人的TE,而ATT只考虑treated group的TE,例如,如果我们现在有吃了药的Peter和没吃药的Danny,那么ATE需要调研的是Peter和Danny相关的confounder,而ATT只关注Peter。但实际上,ATT和ATE之间是有关联的。
参考视频:https://www.youtube.com/watch?v=6Vg10LxmWUY