工具变量检验

最新推荐文章于 2025-01-25 00:00:44 发布

celine0227

最新推荐文章于 2025-01-25 00:00:44 发布

阅读量2.3w

点赞数 18

分类专栏： stata 文章标签：回归

本文链接：https://blog.csdn.net/celine0227/article/details/123490380

版权

stata 专栏收录该内容

29 篇文章

订阅专栏

本文详细介绍了在使用工具变量(IV)进行2阶段最小二乘法(2SLS)回归时的三个关键检验：不可识别检验、弱IV检验和过度识别检验。不可识别检验关注工具变量的数量是否足够；弱IV检验通过多个标准判断工具变量的强度；过度识别检验则评估工具变量的外生性。正确执行这些检验对于确保回归结果的有效性和可靠性至关重要。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

用IV做2SLS回归时，需要对IV进行三个方面的检验：

一、不可识别检验

即检验工具变量的个数是否少于内生解释变量的个数，使用的统计量是Anderson LM 统计量/Kleibergen-Paap rk LM统计量。

这里p值小于0.01说明在 1%水平上显著拒绝“工具变量识别不足”的原假设，也就是要求p值不能大于0.1。

检验时加robust是Kleibergen-Paap rk LM统计量；不加robust是Anderson LM 统计量。

也就是说在iid情况下看Anderson LM 统计量，在非iid情况下看Kleibergen-Paap rk LM统计量。

二、弱IV检验

弱IV是指IV与内生解释变量的相关性不强，微弱相关，弱IV会导致用IV估计的结果与用OLS，FE估计的结果相差很大，甚至符号完全相反。如果有较多工具变量，可舍弃弱工具变量，因为多余的弱工具变量反而会降低第一阶段回归的 F 统计量。

弱IV的判断有以下四个标准：
（1）偏R2，也就是Shea's partial R2，不过xtivreg2不汇报这个统计量，得用命令

estat firststage, all forcenonrobust，汇报第一阶段的结果。

（2）最小特征统计量，minimum eigenvalue statistic，这是Stock and Yogo （2005）提出来的，stata会在ivreg2中给出临界值。Staiger and Stock （1997）建议只要该值大于10就认为不存在弱IV。这个值用于iid的情况。

（3）Cragg-Donald Wald F统计量，由Cragg and Donald （1993）提出，Stata在回归时会给出临界值。CDW检验一般过15%，10%的临界值就可以，过了5%的临界值更好。

如果假设扰动项为iid，则看CDW检验统计量。如果不对扰动项作iid的假设，则看KP W rk F统计量。所以加r选项时才有KP W rk F统计量，不加则没有。不管加不加r选项，CDW统计量总有。通常建议加上r选项。

（4）Kleibergen-Paap Wald rk F统计量。对于CDW统计量和KP W rk F统计量要从估计偏误和检验水平扭曲两个方面进行判断是否存在弱IV问题。

一般情况下这四个值都会看，基本上几个值都是同向变化的。

三、过度识别检验

过度识别的前提是该模型至少是恰好识别的，也就是有效IV至少与内生解释变量一样多，愿假设是H0:所有IV都是外生的，拒绝愿假设意味着至少有一个IV不是外生的，与扰动项相关。

三个统计量：

（1）Sargan统计量。Stata默认给出Sargan统计量。如果内生变量的数目和工具变量的数目完全相同。此时无需执行过度识别检验，因为模型是恰足确认的（equation exactly identified）。这里要求p大于0.1。

（2）Hansen J统计量，加选项robust时汇报Hansen J统计量，不加robust选项时汇报Sargan统计量。也就是说iid时用Sargan统计量，非iid时用Hansen J统计量。

（3）C统计量，加orthog（varlist），varlist为需要检验外生性的变量。与过度识别约束检验有关的另一个检验是对工具变量子集是否符合外生性假定的检验，可通过 difference-in-Sargan 统计量进行; 该统计量由两个 Sargan( 或 Hansen-J) 之差构成，也称为 C 统计量。

xtivreg2 ln_Cash_ratio1 (lnnumber_in_10km=popnum) $control,fe cluster(stkcd) first endog(lnnumber_in_10km)    // 报告检验结果

--- 结果读法 ---
  -- 相关性检验
     1. estat firststage 弱工具变量   ---> 若 F > 10 说明是强工具变量，好！
     
  -- 外生性检验
     2. estat overid 过渡识别检验  ---> 若 P > 0.05 说明工具变量外生，好！
     3. estat endog  Hausman 检验  ---> 若 P > 0.05 说明工具变量外生，好！