异方差问题
异方差是指随机扰动项的方差不再是常数,而是依赖于下标
,此时高斯-马尔可夫假定下的检验统计量都不成立。
可以通过残差分布图看其波动性。
rvfplot //做横轴为拟合值、纵轴为残差的散点图
检验
F检验
残差的平方对解释变量回归
原假设:回归系数全为0
predict e1,r //生成残差e1
gen sque1 = e1*e1 //生成残差的平方sque1
reg sque1 varlist //残差的平方对解释变量回归
test varlist //检验联合显著性
若p值<0.05,则拒绝原假设,即残差的平方可以被某些解释变量解释,存在异方差。
White检验
原假设:残差同方差
sec install whitetst, replace //安装外部命令White检验
whitetst //法1
estat imtest, white //法2
若p值<0.05,则拒绝原假设,即残差存在异方差性。
B-P检验
原假设:残差同方差
reg varlist //先回归
estat hettest varlist //法1
bpgan varlist //法2
若p值<0.05,则拒绝原假设,即残差存在异方差性。
上面的F检验、White检验和B-P检验三种检验方式的结果一致,即存在异方差性。
处理
OLS+robust稳健标准误
由于异方差是普遍存在的,所以这种方法是最常使用的;
当采用普通标准误时回归系数是显著的,而当采用稳健标准误时就不一定是显著的了。
reg varlist, robust
WLS加权最小二乘法
reg varlist //先回归
predict e, re //生成残差变量e
gen lnesqu = log(e^2) //对残差的平方取自然对数
reg lnesqu var1, noc //将残差平方对某一解释变量var1回归
如果回归的结果显示残差能被某一解释变量解释,其中表示该解释变量能解释残差平方总变动的多少,比如
就表示该解释变量可以解释残差平方总变动的74.47%
采用加权最小二乘法解决异方差问题,由于方差较小的数据提供的信息量较大,方差较大的数据提供的信息量较少,故使用方差的倒数做权重进行回归。
predict yaht //保存用解释变量var1解释的yaht
gen exyaht = exp(yaht) //把方差信息存储于变量exyaht中
reg varlist [aweight = 1/exyaht] //以方差的倒数做权重进行回归
自相关问题
随机变量与自身(不同时间,也叫滞后)的相关性,主要存在于时间序列数据。
可以通过绘制残差和残差的滞后一期的散点图,从图形上观察是否可能存在自相关问题。
tsset time //设定时间序列的时间变量
reg varlist //回归
predict e, re //将回归的残差保存为变量e
gen le = l.e1 //用滞后一期e1生成新变量le
scatter e le //对残差和残差的滞后一期做散点图
corrgram e //残差的相关系数矩阵
检验
做完回归后再进行检验
BG-LM检验
原假设:无自相关问题
estat bgodfrey
若p值<0.05,则拒绝原假设,即残差存在自相关。
Q检验
原假设:无自相关问题
wntestq e
若p值<0.05,则拒绝原假设,即残差存在自相关。
DW检验
estat dwatson
若DW值远小于2,则存在正的自相关。
处理
Newey-West方法
OLS+HAC(异方差与自相关条件下的稳健标准误)
newey varlist, lag(3) //先取Newey-West滞后阶数为3
newey varlist, lag(5) //改变滞后阶数看稳定性如何
将滞后阶数由3改为5之后,重新执行命令,发现Newey-West标准误变化不大,则此方法结束。
OLS+vce(cluster)
聚类稳健标准误,对于面板数据vce(robust)=vce(cluster)
reg varlist, vce(cluster)
FGLS可行广义最小二乘估计
模型满足严格外生性时比较有效,否则可能不一致,不如OLS稳健;
外生性:解释变量与扰动项不相关。
修改模型
可能模型设定有误,比如遗漏自相关的解释变量,或将动态模型错误地设定为静态模型。
处理之后再检验:如果系数的估计值与标准误不会随着估计方法的改变而发生较大幅度的变化,就说明估计结果时比较稳健的。