![77156f8bd2251e7f5124498a6f66b8b2.png](https://img-blog.csdnimg.cn/img_convert/77156f8bd2251e7f5124498a6f66b8b2.png)
工具变量,刚刚开始学起来感觉是一个比较抽象的概念,好吧,可能计量整个学起来就是属于比较抽象的,因此试图以自己的方式来把工具变量说的尽量清楚一些。
首先,要明确工具变量本质上是来解决内生性问题的,比如:研究一个人的工资水平wage由什么决定,我们提出由:性别male,年龄age,智商IQ三个因素决定,因此,我们有:
但是这里有一个问题,即:IQ由于存在测量误差,因此和u相关,这会导致IQ的估计系数
![b48ea3ce5ae40b420a227488c603ce19.png](https://img-blog.csdnimg.cn/img_convert/b48ea3ce5ae40b420a227488c603ce19.png)
因此我们需要来解决这个问题。如何解决呢?可以使用工具变量来解决。假设工具变量是父母的受教育程度z,那么我们首先以图解的形式来看看z的作用到底是什么?
![5fe7b39369bb6eadc6a166bb6660a2c9.png](https://img-blog.csdnimg.cn/img_convert/5fe7b39369bb6eadc6a166bb6660a2c9.png)
z的作用本质上就是z变化引起x变化进而引起y变化(z和x相关,父母的受教育程度和孩子的IQ相关,这个设定是合理的),这个作用纯粹是x对y的影响(受教育程度z和孩子工资不直接相关,因此z不会对y产生直接影响,
内生性问题产生的原因:
1、遗漏和解释变量相关的重要变量
2、测量误差
3、互为因果(x影响y,y也影响x)
如果产生了内生性问题,却不去解决,继续使用OLS估计,就是使得解释变量的系数估计值有偏且不一致。
关于工具变量的使用可以分为以下几种情况:
1、简单回归,一个内生解释变量,一个工具变量,无其他解释变量:直接计算协方差即可
2、多元回归,一个内生解释变量,一个工具变量,多个外生解释变量:结构方程联立求解,其实也就是联立方程组求解
3、模型中只有一个内生解释变量,但是该内生变量有两个或者多个工具变量,无法取舍,并且也想充分利用两个工具变量包含的信息:2SLS, 两阶段最小二乘法
4、模型中有很多内生解释变量:判断阶条件,即:工具变量个数一定要大于内生变量个数(对于每一个内生变量来说),然后和3一样,使用两阶段最小二乘法即可。
两阶段最小二乘法:
第一阶段:判断工具变量是否有效,因为你不能随便找一个变量就说他是工具变量,这里主要是判断是否是好的工具变量(即工具变量和内生解释变量之间的相关性,得强相关才行,如果弱相关就会出现问题),所以第一步就是用内生解释变量对工具变量和模型中的其他变量做回归,其实也就是把原来的wage换成了IQ。
第二阶段:用第一步中拟合的
一些需要注意的问题:
是否有内生性问题:
如果没有内生性问题,那么OLS更加合适(因为OLS估计量的方差更小)
检验方法1:
使用Hausman test,Hausman test的原假设是:所有解释变量均为外生变量,然后比较iv估计值和ols估计值和的差异,如果很大,说明存在内生性问题,如果比较小,则不存在。
但是不能够过度依赖Hausman test,也就是说即使Hausman test结果表明内生性问题不显著,一般情况下也还是需要讨论内生性问题,或者从理论机制、经济学常识说明为什么不会产生内生性问题。
并且,传统的Hausman test不适用于异方差情形,因此可以做如下形式的检验——注意,这里的标准误都需要使用异方差稳健的标准误:
检验方法2:
1、首先把疑似内生变量
2、在原始方程(可能存在内生性问题的方程)中加入
3、检验
_______________________________________________________________________________________
弱工具变量,如果工具变量和内生变量相关性很小,可以证明方差会很大,这就会出问题
解决方式:1、寻找更好的工具变量 2、使用LIML,有限信息极大似然估计法。
过度识别检验:
工具变量也可能和u相关,导致工具变量法会产生误差,所以需要检验工具变量是否严格外生,但是这在恰好识别的时候无法做到,只有工具变量个数大于内生变量个数时才能使用过度识别检验。
工具变量和代理变量的区别:一个必须直接影响wage,另一个则不能直接影响wage。比如:IQ是能力的一个很好的代理变量,但是它却不是能力的一个很好的工具变量。
处理测量误差:
由于解释变量测量误差问题引起的内生性问题,如果我们有两次测量,那么就可以解决这个内生性问题,但是如果我们只有一次测量,则无法解决内生性问题。
工具变量结果外推性:工具变量是LATE(局部平均处理效应,研究结论是否可以外推需要依赖于具体问题)