注意:不同于异方差问题,本篇中的自相关处理均基于时间序列数据,因为一般自相关问题往往出现在时间序列数据中,且在面板数据中出现的异方差、自相关问题往往直接运用聚类标准误即可解决。(且陈强老师提供的自相关检验法是无法用在面板数据中的,异方差的检验可以)
自相关问题的产生,OLS估计量仍然是无偏、一致的,且服从渐进正态分布,但是t检验、F检验均会失效。
常见案例:
- 时间序列中存在的数据持久性或连续性
- 截面数据中可能存在的“溢出效应”以及空间自相关问题(放在后面有专门的章节具体说)
- 人为对数据的插值、取平均等处理
- 本身的模型设定遗漏某个自相关的解释变量导致的误差。
时间算子的补充知识
首先定义时间变量
ttset timevar
四种不同的时间算子:L(Lag滞后)、F(Forward前移)、D(Difference差分)、S (Seasonal Difference季节差分),以滞后为例
n表示x的n阶滞后
Ln.x
n1-n2的运算
L(n1/n2).x
自相关的检验(以下均需要在回归后进行操作)
画残差图
predict e1,res
gen e2=L.e1
twoway (scatter e1 e2)(lift e1 e2)
按上图显示斜率为正则可判定可能存在一定自相关
自相关图和偏自相关图
ac e1
pac e1
接下来需要观察自相关和偏自相关图
如何观察自相关和偏自相关图呢?
类似于时间序列模型中,时间序列模型正是需要去找被解释变量的自相关程度,在时间序列模型中还需观察拖尾与截尾的状态,但在此节,只需看竖线哪一根超出了灰色范围,在上例中,可以明显看出偏自相关和自相关的第一根超出了灰色范围,所以可以在一定范围内判定存在一阶自相关。
BG检验
estat bgodfrey
观察右下角的p值,原假设为“无自相关”,下面的检验也是同理
Q检验
wntestq e1
回归
OLS+异方差自相关稳健的标准误(Newey-West估计法)
先计算一个滞后项:lagn=n^(1/4),n为样本个数
newey y x1 x2 x3,lag(lagn)
FGLS,其中包括PW估计法和CO估计法
CO
prais y x1 x2 x3,corc
注意观察最后一行显示了原先的DW统计值和FGLS转换后的DW统计值,可以明显看出更加接近2了。
PW
prais y x1 x2 x3
有关这种存在滞后项的,都可以在最后加一个nolog,使其不要出现前面冗长的迭代过程。