文章聚焦于复杂处理设置下因果推断方法的综述性研究,涵盖了多值、连续以及捆绑处理等复杂情况。
-
首先介绍了问题背景、基本假设及其变化,并对传统的二元处理设置进行了简要回顾。
-
随后,详细探讨了处理多值、连续和捆绑处理的不同方法,并根据是否遵循无混淆假设将这些方法进行分类。
-
此外,文中还梳理了可用于研究的公开数据集和开源代码,并指出了该领域面临的挑战与未来探索的方向。
这是首次将这三种复杂处理统一归纳,并提供了全面的文献综述。
1 二元处理
二元处理方法一般分为无混淆假设下的方法和存在未观测混杂因素的方法。
(1)无混淆假设下的方法:
-
基于倾向得分的方法(Propensity Score-based Methods):这种方法的核心思想是通过预测单位接受处理的概率来平衡观察到的协变量。
-
双重稳健方法(Doubly Robust Methods):这些方法结合了倾向得分和结果回归模型的优点,即使其中一个模型被错误指定也能得到一致的估计。
-
协变量平衡方法(Covariate Balancing Methods):这类方法旨在确保处理组和对照组之间的协变量分布相似。
-
树基方法(Tree-based Methods):使用决