【小菲stata】面板数据的简单回归分析和检验，附代码和讲解~

小菲stata

于 2024-09-06 10:00:00 发布

阅读量449

点赞数 9

文章标签：回归数据挖掘人工智能数据分析学习数据库论文阅读

本文链接：https://blog.csdn.net/weixin_55060648/article/details/141947702

版权

Hello，大家好，前期给大家介绍了如何将面板数据导入且合并到stata里面，那么今天想给大家介绍一下面板数据最基本的回归，即固定效应模型和随机效应模型，以及做回归之前需要做的几个统计学检验。

这里我直接打开已经合并好的面板数据，如果这个你还不会，再去重温一下我的上一篇文章吧

首先呢，给大家介绍我的数据情况，还是31个省份2009-2017年九年的卫生费用相关数据，sjy是我的因变量实际卫生费用，后面都是我的自变量x

（相关的视频教学可在b站、知乎、抖音/西瓜、腾讯等平台找到，全网同名：小菲stata）

第一步：定义面板数据：

xtset 样本 year

本例：xtset province year

注：第一个是横截面（样本或个体）,第二个是时间，不要反了呀！！！

输入之后，stata会告诉你数据是否平衡，即strongly balanced。

第二步：数据检验：

按照正规程序，面板数据模型在回归前需检验数据的平稳性，而检验数据平稳性最常用的办法就是单位根检验。

最常见的单位根检验方法

单位根检验（如ADF、IPS、LLS、HT），判断是否平稳。那我们就直接上命令吧~

1、ADF单位根检验的命令是

xtunitroot fisher varname, trend dfuller demean lags(1)

我们就以x1为例：

xtunitroot fisher x1, trend dfuller demean lags(1)

可以看到p值是小于0.05，拒绝h0，我们可以说在0.05的基础上，此序列是平稳的。

此外，单位根检验一般是先从水平（level）序列开始检验起，如果存在单位根，则对该序列进行一阶差分后继续检验，若仍存在单位根，则进行二阶甚至高阶差分后检验，直至序列平稳为止。我们记I(0)为零阶单整，I(1)为一阶单整，依次类推，I(N)为N阶单整。

2、LLC检验语法：最简单语法，

xtunitroot llc varname, lag(n)   一般适用T比较大

xtunitroot llc varname, trend demean lags(bic 12) --含个体效应和线性时间趋势项

（demean是为了减轻截面相关对检验的影响；加了bic准则，就是指选取最优滞后阶数，不同个体可以有不同的滞后阶数，12是设置的最大的阶数）

本例：xtunitroot llc x1, trend demean lags(bic 1)

xtunitroot llc varname, demean lags(bic 12) --仅含个体固定效应

3、IPS检验语法：xtunitroot ips 变量名, lag(n) 其他语法同LLC一致

xtunitroot llc x1, trend demean lags(bic 1)

可以用xtunitroot，help一下，便会出现所有的检验命令及其用法和实例:而且有可能不同检验结果不一样，这里具体还需要加各种option，检验不通过，即同阶单整，还需要协整检验等

或者进行取对数处理呀，还有进行滞后和差分，用滞后和差分的数据代入后续回归里面。

常用相同根单位根检验LLC（Levin-Lin-Chu）检验和不同根单位根检验Fisher-ADF检验（注：对普通序列（非面板序列）的单位根检验方法则常用ADF检验），如果在两种检验中均拒绝存在单位根的原假设则我们说此序列是平稳的，反之则不平稳。但很多时候，大家默认ADF拒绝就行。那么大家在写论文的时候就灵活发挥吧~

如果发现面板数据中的每个时间序列都是单位根过程，则应进一步做面板协整检验（panel cointegration tests），考察变量之间是否存在长期均衡的协整关系。

Stata 15 新推出了面板协整检验，可通过 Stata 命令 xtcointtest 来实现，包括 Kao 检验（Kao, 1999），Pedroni 检验 (Pedroni, 1999, 2004)与 Westerlund 检验 (Westerlund, 2005)，其基本句型分别为：

xtcointtest kao y x1 x2

xtcointtest pedroni y x1 x2

xtcointtest westerlund y x1 x2

. Kao 检验，适合变量较多的情况

xtcointtest kao y x1 x2 x3

下方汇报了 5 种不同的检验统计量，其对应的 p 值均小于 0.01，故可在 1% 水平上强烈拒绝“不存在协整关系”的原假设，认为存在协整关系。

Pedroni 检验

下面进行更为灵活的 Pedroni 检验，允许不同面板单位有不同的协整向量与残差自回归系数，并加上时间趋势项

本例：xtcointtest pedroni Dlnsjy Dlnx1 Dlnx2 ,trend（差分后的变量）

（此检验number of regressors may not exceed 7）

Westerlund 检验

下面进行 Westerlund 检验，依然包括时间趋势项。

.xtcointtest westerlund y x1 x2 x3, trend

（此检验number of regressors may not exceed 7）

第三步：面板模型的选择与回归

一种是固定效应模型（Fixed Effects Regression Model）。又分为三种：时期固定效应、个体固定效应、时间个体双固定效应。这是文献中常常被人忽视的，但是如果在空间面板数据下，这种区分非常必要和有价值！而在stata中实现有一定的难度。固定效应的各种模型的选择用固定效应的F检验实现。

一种是随机效应模型（Random Effects Regression Model）。如果固定效应模型中的截距项包括了截面随机误差项和时间随机误差项的平均效应，并且这两个随机误差项都服从正态分布，则固定效应模型就变成了随机效应模型。

在面板数据模型形式的选择方法上，我们经常采用Hausman检验确定应该建立随机效应模型还是固定效应模型。

检验完毕后，我们也就知道该选用哪种模型了，然后我们就开始回归：

Hausman豪斯曼检验，判断何种检验方法。

语法：

xtreg y x1 x2 , fe  （fe是固定效应模型）

est store fe  （保存回归结果）

xtreg y x1 x2 , re     （re是随机效应模型）

est store re （保存回归结果）

hausman fe re （比较两者，顺序一般而言不可以调换）

hausman检验最常用（也有人认为只是理论可信，实际一般），结果p值小于0.05，选择固定效应模型，

但是hausman有时候会出现负数，说明的模型设定有问题，导致Hausman 检验的基本假设得不到满足，遗漏变量的问题，或者某些变量是非平稳等等，需要调整。

因为var(b-B)=var(b)-var(B)在有限样本的情况下，这两个协方差矩阵的差不能保证是正定的，所以可能会出现负数。在这种情况下无法拒绝random effect model，这是由协方差矩阵的相似性引发的。如果想进一步检验到底选择随机还是固定效应，可以用Baltagi(2005,pp.65-73)的式子解决这个问题，这个协方差矩阵永远是非负定的。则采用hausman fe, sigmaless或hausman fe, sigmamore。

大部分情况都是选择固定效应模型，以上的检验结果最好是拒绝原假设，至少要很多个才好(注:这些都值得商榷的，很多也没有定论)。

其实很多时候，这些检验只是为了应付审稿人，统计方法说来说去还是主观性很强，甚至很多人都是以结果为导向的，看自己需要怎么样的结果然后不断试验，那么大家自行领会吧~ 今天这期分享就到这里结束了，谢谢大家的支持~