毕业季:stata语令-面板数据基本分析
1.全样本基本面分析
reg csr X1 lnsize bcash roa lev les tobinq age i.Ind i.year
est store m1
reg csr X2 lnsize bcash roa lev les tobinq age i.Ind i.year
est store m2
esttab m1 m2 m3 m4 using esttab1.rtf, replace
2.虚拟变量分组对比分析
reg csr X1 lnsize bcash roa lev tobinq age i.Ind i.year if zy==1
est store m1
reg csr X1 lnsize bcash roa lev tobinq age i.Ind i.year if zy==0
est store m2
reg csr X2 lnsize bcash roa lev tobinq age i.Ind i.year if zy==1
est store m3
reg csr X2 lnsize bcash roa lev tobinq age i.Ind i.year if zy==0
est store m4
esttab m1 m2 m3,se scalars(N r2 F p) mtitles title(“图1”),using esttab1.rtf,replace
3.固定效应还是随机效应
个体效应的两种形态:固定效应&随机效应
step1.分别检验固定效应&随机效应 是否优于混合回归
step2.固定效应&随机效应 通过hausman检验选择
命令:
xtreg csr X1 lnsize bcash roa lev les tobinq age i.Ind i.year , fe
estimates store FE
xtreg csr X1 lnsize bcash roa lev les tobinq age i.Ind i.year , re
estimates store RE
hausman FE RE,constant sigmamore
结果
FE 中p值越小越说明 FE回归优于混合回归;
RE 中p值越小越说明 RE回归优于混合回归;
HAUSMAN 检验中 Prob>chi2 越小越说明 FE优于RE;
固定效应的缺陷
它只能反映随时间而变的变量信息,不随时间而变的变量(如你现在模型中的Industry)
会自动被omitted(遗漏)掉的。而如果加入时间的虚拟变量,固定效应模型就变为双向固定效应模型了
堆积:
你先xtreg, fe,结果底下有个F test that all u_i=0,
这个检验如果不通过,即p值很小,那么混合回归reg就不能用。
接下来,就是fe和re的选择了
对于宽而短(N远大于T)的样本,随机效应模型和固定效应模型的估计结果可能相差很大。
究竟哪一个更好些,不好一概而论,因为各有优缺点。至于在实际应用中具体采用哪一种,
需要通过一定的准则进行判断。
1.根据数据类型判断:宏观数据一般用固定效应(因为大量偶然性波动通过数据汇总抵消了);
微观数据一般用随机效应;
2.根据个体数目判断:如果个体是的全部总体单位,目的在于描述总体(如用全国各省份数据),
一般用固定效应;如果个体是随机抽取的一部分总体单位,目的在于推算总体(如家计调查数据),
一般用随机效应;
3.根据模型参数估计量性质判断:最常用的是Hausman 检验
encode firmcode,gen(firm)
xtset firm year
drop csr firmcode
rename csr1 csr
gen shortr=shortloan/size
强制转换类型
destring gov2 ,replace force
destring var1,gen(var2)
esttab m1 m2 ,se scalars(N r2 F) mtitles title(“图1”),using esttab1.rtf,replace
- 常见问题
Qestion:
reg命令:reg,robust 和 reg,cluster(clu