更多精彩内容请关注211统计课堂
上期小统和大家一起了解了STATA数据处理技巧与计量分析中的部分回归分析偏误处理知识,这期小统和大家继续学习一下剩下的知识点~
偏误处理之三 共线性
假定SLR.2 解释变量X是确定性变量,不是随机变量,且各解释变量之间无完全多重共线性(相关性)。
某两个变量或者多个变量之间相关性太强,或某一个变量能被其他变量线性表示,则存在多重共线性问题。
后果:
- 完全共线性下(很少)参数估计量不存在(即某些系数无法估计出来结果)
- 近似共线性下(常见)系数估计量方差很大,影响t检验、F检验
- 可能导致系数经济含义不合理。
检验:差膨胀因子VIF是否大于10(有一定缺陷)
处理:
- 剔除相关性过强的变量。
- 若不关心具体的回归系数,只关心整个方程预测被解释变量的能力,则不必理会共线性。
- 若关心具体的回归系数,但共线性问题不会影响所关心变量的显著性,那么也不必理会。
方差膨胀因子: