1 PSM简介
倾向评分匹配(Propensity Score Matching,简称PSM)是一种统计学方法,用于处理观察研究(Observational Study)的数据。
在观察研究中,由于种种原因,数据偏差(bias)和混杂变量(confounding variable)较多,倾向评分匹配的方法正是为了减少这些偏差和混杂变量的影响,以便对实验组和对照组进行更合理的比较。
这种方法最早由Paul Rosenbaum和Donald Rubin在1983年提出,一般常用于医学、公共卫生、经济学等领域。
在医学领域,常用于比较两种干预因素的研究效果
以SEER数据库挖掘过程中,碰到的常见选题,简单举例:
胃癌患者中,手术联合化疗,对比单纯手术,比价两种治疗模式效果
一般情况下,我们直接在文章的表1里面,摆放患者基线特点clinical characteristics
如果此时两种治疗模式下,患者年龄或者性别,存在分布差异
这时候就存在了研究人群变量选择偏移,误差因素就存在里面,结果准确性就值得怀疑,因为我们说不清,两组患者生存差异,是治疗模式加上化疗,带来的差异,还是由于本身两组人群在年龄、性别等因素分布差异所致
PSM的存在,正是为了消除这种基线差异,使我们的分析,更接近于RCT研究,也越来越受到研究者青睐。