- 导读规则:
- 正文出现红色字体,对应Stata命令;
- 正文中出现蓝色字体,对应往期链接;
- do文件中:"//"符号代表作者注释内容,帮助理解;"**"代表分节,便于阅读
数据获取:https://pan.baidu.com/s/1liB0MXMNWDImfzzlOCq5vA 提取码:rh58
本文关键词:异方差 多重共线性 自相关
参数的估计和统计推断涉及的假定有6个,多重共线性、同方差对应假定3和假定5,序列自相关则也是保证估计量是BULE的重要假定。虽然现在的实证计量主要矛盾是寻找数据和方法来保证假定4的满足,但如何验证其他几种假定有时也能为一些出乎意料的实证结果提供解决思路,当然这也是计量入门需要掌握的知识点。今天简单汇总了一下这些假定的检验方法,主要参考了陈强老师的高级计量经济学,当然中间涉及了如何用Stata计算各种分布的临界值的命令以及如何提取回归储存的结果,有需要者可摘取阅读。
do文件如下: 【20201129】模型常见问题 copyright@梦想不大 **************************************************************************** clear all cap log close version 16.0 set more off global path "F:\Learn\模型常见问题" cd $path cap ssc install rvfplot,replace log using "case",replace text use "nerlove.dta",clear 1、异方差检验 **************************************************************************** ****【1】画X与Y的散点图 twoway scatter tc q || lfit tc q, /// ylabel(,nogrid) graphregion(color(white)) // 初步判断:递增型异方差 ****【2】画残差平方项uhat2与X的散点图 cap drop yhat uhat uhat2 reg tc q predict yhat,xb predict uhat,r gen uhat2=uhat^2 twoway scatter uhat2 q || lfit uhat2 q, /// ylabel(,nogrid) graphregion(color(white)) ****【3】画残差平方项uhat2与拟合值yhat的散点图 cap drop yhat1 reg tc q pl pk predict yhat1,xb twoway scatter uhat2 yhat1 || lfit uhat2 yhat1, /// ylabel(,nogrid) graphregion(color(white)) ****【4】戈德菲尔德-夸特(G-Q, Goldfeld-Quandt)检验: *n=145,c=17,(n-c)/2-k-1=64-3-1=60 regress tc q pl pk in 1/60 scalar s_small = e(rmse)^2 scalar df_small = e(df_r) regress tc q pl pk in 78/145 scalar s_large = e(rmse)^2 scalar df_large = e(df_r) scalar GQ = s_large/s_small scalar crit = invFtail(df_large,df_small,.05) scalar pvalue = Ftail(df_large,df_small,GQ) scalar list GQ pvalue crit ****【5】布罗施-帕甘(BP, Breusch and Pagan)检验: regress tc q pl pk predict ehat, residual gen ehat2=ehat^2 quietly regress ehat2 q pl pk di "NR2 = " e(N)*e(r2) di "5% critical value = " invchi2tail(e(df_m),.05) di "P-value = " chi2tail(e(df_m),e(N)*e(r2)) *#等价于 quietly regress ehat2 q pl pk estat hettest, rhs iid //使用方程右边的解释变量 estat hettest, iid //默认使用拟合值 help estat hettest quietly regress ehat2 q pl pk c.q#c.q c.pl#c.pl c.pk#c.pk di "NR2 = " e(N)*e(r2) di "5% critical value = " invchi2tail(e(df_m),.05) di "P-value = " chi2tail(e(df_m),e(N)*e(r2)) ****【6】怀特检验(White test) quietly regress tc q pl pk estat imtest, white 2、异方差修正 **************************************************************************** ****【1】异方差-稳健的标准误/稳健标准: regress tc q pl pk regress tc q pl pk,r // 系数不变,标准误变大 ****【2】加权最小二乘估计(WLS,Weighted Least Squares): cap drop ehat ehat2 regress tc q pl pk predict ehat, residual gen ehat2=ehat^2 gen lnehat2=log(ehat2) reg lnehat2 q pl pk,noc predict lnehat2f gen ehat2f=exp(lnehat2f) reg tc q pl pk [aw=1/ehat2f],r reg tc q pl pk 3、多重共线性检验 **************************************************************************** ****【1】相关系数检验: *# 判断值0.8 corr q pl pk ****【2】辅助回归法: reg q pl pk scalar R2_q=e(r2) reg pl q pk scalar R2_pl=e(r2) reg pk q pl scalar R2_pk=e(r2) *#发现变量之间的R2都比较小 scalar list R2_q R2_pl R2_pk ****【3】方差膨胀因子法: *# 判断值10 regress tc q pl pk,r estat vif ****【4】直观判断法: regress tc q pl pk,r // R2较高但t基本都显著,基本不存在多重共线性问题 use "icecream.dta",clear tsset time 4、序列自相关的检验方法:参考陈强,2015 **************************************************************************** ****【1】看残差与残差滞后一期的散点图: cap drop ehat ehatl regress consumption price income temp predict ehat, residual gen ehatl=L.ehat scatter ehat ehatl, msymbol(Oh) mc(cranberry) /// xlabel(none) xsca(off) /// yline(0,lc(navy) lw(0.25)) /// graphregion(color(white)) legend(off) // 初步判断:看不出关系 ****【2】看残差与t的散点图: twoway (scatter ehat time, msymbol(Oh) mc(navy)) (lpoly ehat time,bw(2.5)), /// xlabel(none) xsca(off) /// yline(0,lc(gs18) lw(0.15)) ylabel(,nogrid labsize(small) tl(1.5)) /// graphregion(color(white)) legend(off) // 残差随着t的变化逐次变化且未频繁地改变符号,而是几个正的后面跟着几个负的,初步判定随机误差项残差可能存在正自相关 ****【3】自相关和偏自相关图: ac ehat pac ehat //pac显示快速衰减到标准差之内,主要为一阶自相关,可忽略高阶自相关 ****【4】BG检验/LM检验: estat bgo // 在5%的显著性水平上拒绝原假设,故存在自相关 wntestq ehat // Q检验(陈强,2010):在5%的显著性水平上拒绝原假设,故存在自相关 ****【5】DW检验: estat dwatson // DW值为1.02,距离2比较远,判定存在自相关 5、序列自相关的修正方法,参考陈强,2015 **************************************************************************** ****【1】异方差+自相关稳健标准误(HAC,Heteroskedasticity and Autocorrelation Cons): newey consumption price income temp,lag(3) // p=n^0.25=30^0.25=2.34 regress consumption price income temp // 系数不变,标准误变大 ****【2】广义差分法/广义最小二乘法(FGLS): *(1)科克伦-奥科特迭代法(Cochrane-Orcutt):未考虑第一个观测值 prais consumption price income temp,corc reg consumption price income temp // 系数估计值与显著性与OLS接近 *(2)Prais-Winsten估计法:考虑第一个观测值 prais consumption price income temp reg consumption price income temp // help prais查看具体命令 // 系数估计值与显著性与OLS有较大差异,income系数为负 log close
趁机练了练画图,怕忘记怎么写代码。献上丑图一张,至于对应哪部分代码,自己动手找找看!
新手上路一枚,有解读错误的地方请大家多多指正!
点个赞、打个赏、转个发,都是对作者莫大的鼓励!