如前所述,缺少反事实和混杂因素偏差是治疗效果评估中的两个主要挑战。 基于匹配的方法提供了一种估计反事实的方法,同时减少了混杂因素带来的估计偏差。通常,通过匹配估计的第i个unit的潜在结果为:
其中和
是估计的对照和治疗结果,J(i)是相对治疗组中unit i的匹配邻居。
匹配样本的分析可以模仿RCT:可以直接比较匹配样本中治疗组和对照组的结果。在RCT的背景下,人们期望平均而言,治疗组和对照组之间的协变量分布相似。因此,当使用观察数据估计治疗效果时,可以使用匹配来减少或消除混淆的影响。
3.3.1距离度量
已经采用了各种距离来比较unit之间的紧密度,例如广泛使用的欧几里得距离和马氏距离。同时,许多匹配方法都开发了自己的距离度量,可以将其抽象为:。现有的距离度量标准主要在如何设计变换函数f(·)方面有所不同。
基于倾向得分的转换 unit的原始协变量可以用倾向得分表示。作为结果,两个unit之间的相似度可以直接计算为:D(xi,xj)= | ei-ej |,其中ei和ej分别是xi和xj的倾向得分。
后来,还提出了基于线性倾向得分的距离度量,其定义为