内生性问题
- “内生性”名称的由来
现在人们说某个模型有内生性问题(endogeneity issue),是指模型中的一个或多个解释变量与误差项存在相关关系。
显然,这个解释和内生性这个名字有点不搭。其实内生性问题字面含义是指模型中的解释变量有内生性(endogeneity)。
在一个模型中,有些变量的值是在模型内部决定的,是内生的(endogenous);有些变量的值是被模型外界决定的,是外生的(exogenous)。在一般模型中,被解释变量应该是内生的,解释变量应该是外生的,解释变量的取值是不能被我们的模型所决定的。内生性问题字面意思指的是解释变量不是完全外生了,有了内生性了。
此种内生性问题的一个常见症状就是解释变量和误差项存在相关关系。但不知从什么时候起,人们开始把一切“解释变量和误差项存在相关关系”的情况都叫做内生性问题了,也不管它是什么原因导致的。(关于这一点,可以参考Dougherty《introduction to econometrics》第十章和Wooldridge《Introductory Econometrics》第三章)
所以就这么叫吧,没什么好纠结的了。
- 存在内生性问题的后果
内生性会破坏参数估计的“一致性”。
参数估计的“一致性”就是指当样本量很大时,用样本估计出的参数会无限趋近于总体的真实参数。当我们用样本估计出的参数没有了一致性,那它也就没什么参考价值了。
- 内生性问题的产生原因
主要有以下几种,当然也不完全,我用简单的单方程线性模型举例:
1)测量误差(measurement error)
测量误差指的是模型使用的解释变量的数值和真实数据有误差。
2)选择偏差
3)遗漏解释变量(explanatory variable omitted)
现实问题总是复杂的,一般情况下,谁也没办法找到所有能影响被解释变量的变量,遗漏解释变量几乎是不可避免的。
4)互为因果(simultaneity)
被解释变量能够反过来影响解释变量的情况被称为互为因果,有时也被称为反向因果(reverse causality)。