[编译] 吴思锐 (湖南大学),wusirui@hnu.edu.cn
Source: Xu R, Frank K A, Maroulis S J, et al. konfound: Command to quantify robustness of causal inferences[J]. The Stata Journal, 2019, 19(3): 523-550. Link
连享会 最新专题
1 引言
未控制的混淆变量或非随机选取样本可能会导致偏差,为了评估因果推断偏差的稳健性,许多敏感性分析方法应运而生。然而,之前的多数方法要么仅仅控制某一特定来源的偏差(如遗漏变量),要么是仅适用于特定类型的数据(如分类变量)。本文主要介绍 konfound
命令,用以在 Stata 中执行如下两个检验:
- 使用 Rubin 因果模型解释偏差导致因果推断失效的程度;
- 根据回归模型中其他变量与不可观测变量的相关系数量化因果推断的稳健性。
具体而言, konfound
命令可用于检验模型的稳健性,mkonfound
命令可用于检验多次研究的稳健性,pkonfound
可用于检验对某一已发表研究的稳健性。接下来,我们简要介绍这两种方法的理论基础及在 Stata 中如何使用。对于该方法更加深入详细的介绍,可参考 Frank (2000), Pan 和 Frank (2003), Frank 和 Min (2007), Frank 等 (2008, 2013) 等文献。
2 因果推断的稳健性
2.1 遗漏的混淆变量的影响阈值
在观察性研究和准实验研究中,遗漏变量偏差是影响因果推断的一个关键问题。也就是说,有一些不可观测的混淆变量与自变量和因变量均相关,从而使模型估计产生偏差,使得推论无效。Frank (2000) 对这种混淆变量影响因果推断的程度进行了量化,他定义了混淆变量对因果推断的影响为
2.2 使推断无效的偏差百分比
第二种方法从评价估计中使推论无效的偏差比例开始(Frank et al., 2013)。偏差百分比被定义为能够被原假设替代从而使推论无效的可观测样本比例。这些替代可能来自反事实数据,如 Rubin 的因果模型(Rubin, 1974),也可能来自未被选取的样本。使用这一拐点,可以解决关于外部效度或关于内部效度的问题。
该方法源于将一个估计值与一个阈值对比时,要多大偏差才能使推论转变。例如,假设研究 A(估计效果为 6)和 B(估计效果为 8)的处理效果都超过了推断 4 的阈值。但是研究 B 的估计效果超出阈值的程度超过了研究 A 的估计效果(假设这些估计是在研究设计的选择偏差控制水平和精度水平相似的情况下获得的)。因此,我们认为研究 B 得出的推论比研究 A 得出的推论更可靠,因为研究 B 得出的估计有更大的比例是由于偏差而使推论无效。
连享会 最新专题
3 konfound
命令
konfound varlist [, sig (#) nu (#) onetail (#) uncond (#) rep_0 (#) non_li (#)]
3.1 概述
konfound
命令用来计算遗漏的可能使因果推断回归系数失效的混淆变量的影响,它也可以用来评价遗漏变量和被解释变量以及解释变量相关的程度。在选取模型后(如线性回归模型),用户提供一系列变量名称,konfound
命令将会计算遗漏变量对每一个变量的影响,以此来判断因果推断的有效性。 konfound
命令还可以提供用户之前模型中所有可观测的协变量的的影响。这些可以用作评价遗漏的混淆变量对因果推断有效性影响的基准。
此外,konfound
还可以计算在估计中因果推断有效性偏差的大小。在选取模型后,用户可以提供一些列变量名称,konfound
命令将会计算每一个变量的偏差百分比,konfound
还可以提供用户模型中在统计意义上显著的变量的灵敏度图。
3.2 命令选项
- sig (#) 指明显著性水平,默认值为 sig (0.05)<