? 连享会主页:lianxh.cn
![7dff2fd91a3735420cc010f48e0f8d3a.png](https://i-blog.csdnimg.cn/blog_migrate/47eb49c8c29719f0345f9c70feac9521.png)
New!
lianxh
命令发布了: GIF 动图介绍
随时搜索 Stata 推文、教程、手册、论坛,安装命令如下:. ssc install lianxh
连享会 · 最受欢迎的课
? 2021 Stata 寒假班
⌚ 2021 年 1.25-2.4? 主讲:连玉君 (中山大学);江艇 (中国人民大学)
? 课程主页:https://gitee.com/arlionn/PX
![cf800a8e6c91214072ec42c521a55ad5.png](https://i-blog.csdnimg.cn/blog_migrate/d5ce092995310a63291b77213d447747.png)
作者: 游万海 (福州大学) | 连玉君 (中山大学)主页: www.lianxh.cn
目录
1. 模型形式设定
2. 模型分类与选择
2.1. 固定效应的检验
2.2. 随机效应的检验
2.3. 固定效应还是随机效应?
3. Stata 实现
3.1. 读取数据与面板数据设定
3.2. 模型检验与模型选择
3.3 几点说明
4. 总结
5. 附录:文中所用 Stata dofiles
6. 参考文献和扩展阅读
7. 相关推文
导言:
面板数据模型的使用几乎遍及所有研究领域,但对于初学者而言,似乎总有一道心结始终无法解开,总觉得「面板数据」很高大上,无形中给自己施加了很大的压力。为此,中山大学连玉君老师做了一个公开课 —— 直击面板数据模型 ( 课程主页:https://gitee.com/arlionn/PanelData )。目前,这个课程的受众超过 5000 人次。连老师为此课程定制了课程主页,用于分享课件、dofile 和参考文献,欢迎各位前往下载或【Fork】。
![946f19ccce3f56b97777d50c92a4227c.png](https://i-blog.csdnimg.cn/blog_migrate/cecf485b6188ca13025525cb44e983b8.png)
如下是连玉君老师公开课 直击面板数据模型 ( 课程主页:https://gitee.com/arlionn/PanelData ) 上课的板书。你可以看出什么是 「固定效应」,什么是 「双向固定效应模型」,什么是 「POLS」 v.s. 「FE」 以及二者的差别。
![369f7de3d614e59c51a0832e54f7293a.png](https://i-blog.csdnimg.cn/blog_migrate/d3097a5d81487ef43f7495db5c56cbd1.png)
所以,面板数据模型其实没有你想象的那么复杂!
![5f27e9a1b9017df933ec1aba893e3812.png](https://i-blog.csdnimg.cn/blog_migrate/c03c758998acf716547a8b6ef292c2b6.png)
常见的数据形式有时间序列数据( Time series data ),截面数据( Cross-sectional data )和面板数据( Panel data )。
从维度来看,时间序列数据和截面数据均为一维。面板数据可以看做为时间序列与截面混合数据,因此它是二维数据。数据形式如下:
![5706c28af858bbafda656ec6b2938194.png](https://i-blog.csdnimg.cn/blog_migrate/d05717c24bb66012f2cdd74a75dbc857.png)
世界是复杂的,所表现出来的行为特征也是复杂的,我们需要面板数据。
例如,欲研究影响企业利润的决定因素,我们认为企业规模 (截面维度)和技术进步(时间维度)是两个重要的因素。截面数据仅能研究企业规模对企业利润的影响程度,时间序列数据仅能研究技术进步对企业利润的影响,而面板数据同时考虑了截面和时间两个维度 (从哪个维度看都好看),可以同时研究企业规模和技术进步对企业利润的影响。
正因为面板数据所具有的独特优势,许多模型从截面数据扩展到面板数据框架下。通过 findit panel data
命令可以发现目前 Stata 已有许多相关面板数据模型命令,包括(不限于):
xtreg/reghdfe
:普通面板数据模型,包括固定效应与随机效应xtivreg2
:工具变量面板估计xtabond/xtdpdsys/xtabond2/xtdpdqml/xtlsdvc/xtdpdgmm
:动态面板数据模型spxtregress/xsmle
: 空间面板数据模型xthreg
: 面板门限模型xtqreg/qregpd/xtrifreg
: 面板分位数模型xtunitroot
: 面板单位根检验xtcointtest/ xtpedroni/xtwest
: 面板协整检验sfpanel
: 面板随机前沿模型xtpmg/xtmg
:非平稳异质面板模型- ……
本文主要就普通静态面板数据模型进行介绍,包括模型形式设定、模型分类与选择及 Stata 程序实现等。
1. 模型形式设定
面板数据模型同时包含了截面和时间两个维度,设 (=1, , ) 表示截面 (个体), () 表示时间,设定如下线性模型:
其中,
- 为 因变量,
- 为 自变量,
- 为模型误差项, 是待估计参数,表示 对 的边际影响。
- 表示个体效应,表示那些不随时间改变的影响因素,如个人的消费习惯、企业文化和经营风格等;
- 表示时间效应,用于控制随时间改变因素的影响 (时间虚拟变量包括时间趋势项,时间趋势主要用于控制技术进步),如广告的投放 (往往通过电视或广播,我们可以认为在特定的年份所有个体所接受的广告投放量相同)。
显然, 和 在多数情况下都是无法直接观测或难以量化的,因此也就无法进入模型。在截面分析中往往会引起遗漏变量的问题。
面板数据模型的主要用途之一就在于处理这些不可观测的个体效应或时间效应。当对所有的 , 均相等时,模型退化为混合数据模型 ( Pooled OLS ),可直接用 reg y x
命令进行参数估计。
根据个体数 和时期数 的大小,通常可以将面板数据分为宏观面板和微观面板:宏观面板一般为 「大 小 」,微观面板一般为「小 大 」。依据 、 大小不同,所采用的参数估计方法和分析中关注的重点也不尽相同。
2. 模型分类与选择
面板数据模型可以分为固定效应( Fixed effect model )和随机效应模型( Random effect model )。当 和 相关,即 ,则该模型为固定效应模型;反之为随机效应模型。
两种模型的差异主要反映在对 “个体效应” 的处理上。
固定效应模型假设个体效应在组内是固定不变的,个体间的差异反映在每个个体都有一个特定的截距项上;随机效应模型则假设所有的个体具有相同的截距项, 个体间的差异是随机的,这些差异主要反应在随机干扰项的设定上。
基于此,一种常见的观点认为, 当我们的样本来自一个较小的母体时,我们应该使用固定效应模型,而当样本来自一个很大的母体时, 应当采用随机效应模型。
然而,在具体的实例应用中,大母体和小母体并没有一个严格的界限,我们并不能明确地区分我们的样本来自一个较大母体还是较小的母体。因此,有些学者认为,区分固定效应模型和随机效应模型应当通过检验使用二者的假设条件是否满足。
下面我们讨论混合数据模型、固定效应模型和随机效应模型的选择。
2.1. 固定效应的检验
固定效应的检验本质即检验个体间截距项的差异是否显著,即 ====0。根据假设检验原理,设定如下原假设
若结果拒绝原假设,则表明个体间截距项存在显著差异,模型中需要考虑固定效应。反之,混合 OLS 模型更为合适。通常可以利用 统计量来检验上述假设是否成立:
其中: 为固定效应模型的拟合优度系数(不受约束模型), 为混合数据模型的拟合优度系数(受约束模型); 和 分别为截面与时期数; 为解释变量个数。若原假设被拒绝,则说明个体效应显著,固定效应模型比混合数据模型更优。同理,可以构造相似的 统计量检验时期效应是否显著。
2.2. 随机效应的检验
Breusch and Pagan (1980) 提出了基于面板随机效应模型残差的 LM统计量,构造如下原假设来检验随机效应:
相应的检验统计量LM为:
在原假设下,该统计量服从自由度为 1 的卡方分布。若拒绝原假设则表明存在随机效应。
2.3. 固定效应还是随机效应?
通过检验说明个体效应 () 需要被纳入到模型中后,应该将 看成随机干扰项的一部分(随机效应模型)还是待估计参数 (固定效应模型),