目录
一、引言
倾向匹配得分模型(Propensity Score Matching,PSM)是一种在观察性研究中用于减少选择偏差的常用方法。通过估计个体接受某种处理(例如参与某个项目、接受某种治疗等)的概率,即倾向得分,然后基于倾向得分对处理组和对照组进行匹配,以构建类似于随机实验的样本,从而使得处理组和对照组在可观测特征上具有可比性。
二、文献综述
在社会科学和医学研究等领域,PSM 方法得到了广泛的应用。Rosenbaum 和 Rubin(1983)首次提出了倾向得分匹配的概念和方法,为后续的研究奠定了基础。他们指出,通过倾向得分进行匹配,可以有效地控制观察性研究中的混杂因素,从而更准确地评估处理效应。
例如,Smith 和 Todd(2005)在研究教育政策对学生成绩的影响时,运用 PSM 方法来解决样本选择偏差问题,使得研究结果更具可靠性。Athey 和 Imbens(2006)则在处理经济数据时,采用 PSM 方法来评估政策干预的效果,为政策制定提供了有力的依据。
此外,Hirano 和 Imbens(2001)对 PSM 的理论和应用进行了深入的探讨,进一步完善了该方法的理论框架。在医学领域,Austin(2011)等人利用 PSM 方法评估了不同医疗治疗方案的效果,为临床决策提供了重要的参考。
这些研究都充分展示了 PSM 方法在解决观察性研究中选择偏差问题的有效性和实用性。
三、理论原理
倾向匹配得分模型(PSM)的理论基础建立在反事实框架和条件独立性假设之上。
在观察性研究中,我们通常将个体分为处理组(接受了某种处理或干预)和对照组(未接受处理或干预)。然而,由于个体并非随机分配到处理组和对照组的,可能存在一些混杂因素导致两组个体在特征上存在系统性差异,从而影响对处理效应的准确评估。
四、实证模型
- 估计倾向得分
- 通常采用 Logistic 回归或 Probit 回归来估计倾向得分。假设处理变量为
Treatment
,协变量为X1
、X2
、... 、Xn
,则 Logistic 回归模型可以表示为:
- 通常采用 Logistic 回归或 Probit 回归来估计倾向得分。假设处理变量为