计量经济学公众号发布《面板数据门限回归模型及扩展》的文章后,关注公众号的朋友提出门限模型和断点回归有什么区别?门限模型解决的问题是,门限变量达到某一数值后,其对应的解释变量和被解释变量的因果关系发生了较彻底的改变,如对应解释变量的系数由负数变为正数,或数值上发生很大变化。断点回归本质上可以看作“弱化版”的随机实验,解决的问题是某个事件(如政策实施,以处理变量表示)的发生对一组性质“差不多”的个体产生何种影响。断点回归的具体内容如下:
1模型应用价值
断点回归设计(Regression Discontinuity Design,RDD)最早是由Thistlethwaite and Campbell(1960)提出,用来研究奖学金对学生未来成绩的影响。随着自然实验的兴起,RDD在经济学领域沉寂多年后被重新发现,用于检验因果关系。Hahn et al.(2001)对RDD策略的识别条件、估计方法、统计推断进行了理论上的证明,使得断点回归在经济学、政治学及社会学等领域广泛应用,成为目前政策效应评估的实证分析中最为热门的一种研究设计策略。
以奖学金对学生未来成绩的影响为例说明断点回归的应用价值。假设获取奖学金的分数线为60分, 是我们关心的个体i的未来成绩,
分别是取得奖学金和未取得奖学金学生的未来成绩。最直观的想法是直接计算
的差值是多少,但我们不可能同时观测
的值。RDD解决这个问题的思路是,假定考试成绩为57、58、59、60、61、62的学生的知识基础、学习能力、努力程度、智力水平、应试能力等各个方面决定考试成绩的因素都没有显著差异。我们将考试成绩为60、61、62分的样本划分为处理组,将考试成绩为57、58、59分的样本划分为控制组,两组样本的成绩分布很大程度上是随机的。更一般地,对于较小的c>0,考试分数在[60-c,60+c]范围内的学生,可以认为是随机分组的。由于是随机分组的,可对在60分附近的局部平均处理效应(Local average treatmenteffect, LATE)进行一致估计:
LATE的数值反映是否取得奖学金对未来成绩的影响。在断点回归中,上述LATE的计算属于精确断点回归,即处理变量D(是否取得奖学金)完全由分组变量X(考试分数)决定。如果处理变量D不完全由分组变量X决定(如考试分数超过60分仅是取得奖学金的一个必要条件),则需要考虑模糊断点回归。
对于变量的取值(如考试分数)在断点(如分数线为60分)附近随机地落在断点左侧(控制组)或断点右侧(处理组),断点回归是一种较好的因果识别方法。断点回归的核心思想是把样本视作一项准自然实验,能较好地解决变量内生性问题。