stata回归?固定效应模型(组内变换OR LSDV最小二乘法)

面板数据分析与Stata应用笔记整理自慕课上浙江大学方红生教授的面板数据分析与Stata应用课程,笔记中部分图片来自课程截图。

笔记内容还参考了陈强教授的《高级计量经济学及Stata应用(第二版)》


一、面板数据的定义

面板数据(panel data或longitudinaldata),指的是在一段时间内跟踪同一组个体(individual)的数据。它既有横截面的维度(n个个体),又有时间维度(T个时期)。是同时在时间和截面上取得的二维数据,又称时间序列与截面混合数据(polled timeseries and cross section data)。

一个T=3的面板数据结构如下所示

二、面板数据的分类

面板数据类型通常分为三类,分别为:

a.短面板数据与长面板数据

b.动态面板数据和静态面板数据

c.平衡面板和非平衡面板

(1)短面板数据与长面板数据

当截面数n大于T时,即为短面板数据;

当截面数n小于T时,即为长面板数据.

(2)动态面板数据和静态面板数据

如果解释变量包含别解释变量的滞后值,则为动态面板数据,反之则为静态面板.

(3)平衡面板和非平衡面板

当每个个体在相同的时间内都有观察值记录,即为平衡面板,反之则为非平衡面板。

三、面板数据的优缺点

1、面板数据的优点

(1)可以处理由不可观察的个体异质性所导致的内生性问题。

(2)提供更多个体动态行为的信息。

(3)样本量较大,可以提高估计的精确度。

2、面板数据的不足之处

(1)大多数面板数据分析技术都针对的是短面板。

(2)寻找面板数据结构工具变量不是很容易。

四、面板数据模型

面板数据模型分为非观测效应模型和混合回归模型两类。存在不可观测的个体效应模型即为非观测效应模型,反之则为混合回归模型。

(1)非观测效应模型

a.固定效应模型

b.随机效应模型

Yit=βxit+αi+εiti=1,⋯,n;t=1,⋯,T

其中, αi 是不可观测的个体效应。

如果 αi 与某个解释变量相关,就是固定效应模型

如果 αi 与所有解释变量不相关,则为随机效应模型

固定效应模型又分为:单向固定效应模型与双向固定效应模型

单向固定效应模型:只考虑个体效应不考虑时间效应;

双向固定效应模型:同时考虑个体效应和时间效应,即

yit=βxit+λt+αi+εit

(2)混合回归模型
如果 αi=0 ,即不存在个体效应,则为混合回归模型,即

Yit=βxit+εiti=1,⋯,n;t=1,⋯,T

五、面板数据模型的估计

1、固定效应模型的估计

对固定效应模型的估计有两种方法:

固定效应变换(组内变换)LSDV(最小二乘虚拟变量法)

a.固定效应变换(组内变换)

固定效应变换的优缺点

优点:即使个体效应与解释变量相关也可以得到一致估计;

缺点:无法估计不随时间而变的变量的影响。

#对固定效应变换无法估计不随时间而变的变量的影响的解决

固定效应模型的Stata的实现命令为:xtreg y x, fe

引入时间效应的双向固定效应的Stata的实现命令为:xi: xtreg y x i.year, fe

#数据来自慕课浙江大学方红生教授的面板数据分析与Stata应用课程(xtreg y x, fe)

#数据来自慕课浙江大学方红生教授的面板数据分析与Stata应用课程(xi: xtreg y x i.year, fe)

b.LSDV(最小二乘虚拟变量法)

#LSDV的基本思想

LSDV的Stata的实现命令为:

不存在时间效应:reg y x i.code

存在时间效应:xi: reg y x i.code i.year

#数据来自慕课浙江大学方红生教授的面板数据分析与Stata应用课程(reg y x i.code)

#数据来自慕课浙江大学方红生教授的面板数据分析与Stata应用课程(xi: reg y x i.code i.year)

2、随机效应模型
对随机效应模型的估计方法是广义最小二乘法

随机效应模型估计的Stata命令

不存在时间效应:xtreg y x ,re

存在时间效应:xi: reg y x i.year,re

短面板数据估计的同时,还需要考虑三大问题

即,误差项的异方差、误差项的自相关、截面相关问题

  • 通过在命令中加入选项“robust”可以获得White稳健标准误,可以解决异方差的问题。
  • 在命令中加入选项“cluster”可以获得Rogers标准误或聚类稳健的标准误,可以同时解决异方差和自相关两大问题。
  • 使用命令xtscc可以同时解决三大问题,提供Driscoll-Kraay标准误。
  • 5
    点赞
  • 85
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
⾯板数据分析步骤 ⾯板数据分析步骤 ⾯板数据分析步骤 阅读笔记, 阅读原⽂请点链接: 1. 单位根检验 单位根检验 分析数据的平稳性,避免出现虚假回归或伪回归。 李⼦奈认为平稳的真正含义是:⼀个时间序列剔除了不变的均值(可视为截距)和时间趋势以后,剩余的序列为零均值,同⽅差,即⽩噪 声。因此单位根检验时有三种检验模式:既有趋势⼜有截距、只有截距、以上都⽆。 对⾯板数据绘制时序图,粗略观测时序图中是否含有趋势项和(或)截距项; 检验单位根的⽅法: LLC法:该⽅法允许不同截距和时间趋势,异⽅差和⾼阶序列相关,适合于中等维度(时间序列介于25~250 之间,截⾯数介于10~ 250 之间) 的⾯板单位根检验。 IPS法 Breitung法 ADF-Fisher PP-Fisher 有时为了⽅便,只采⽤两种⾯板数据单位根检验⽅法,即相同单位根检验LLC,和不同单位根检验Fisher-ADF检验。 存在单位根的解决⽅法:使⽤⼀阶差分或⼆阶差分及⾼阶差分,直⾄序列平稳为⽌。 2. 协整及调整模型 协整及调整模型 情况⼀:如果基于单位根检验的结果发现变量之间是同阶单整的,那么我们可以进⾏协整检验。 情况⼆:如果如果基于单位根检验的结果发现变量之间是⾮同阶单整的,即⾯板数据中有些序列平稳⽽有些序列不平稳,此时不能进⾏协整 检验与直接对原序列进⾏回归。此时应该对模型进⾏修正,消除数据不平稳对回归造成的不利影响。 3. 进⾏回归 进⾏回归 混合估计模型:如果从时间上看,不同个体之间不存在显著性差异;从截⾯上看,不同截⾯之间也不存在显著性差异,那么就可以直接 把⾯板数据混合在⼀起⽤普通最⼩⼆乘法(OLS)估计参数。 固定效应模型:如果对于不同的截⾯或不同的时间序列,模型的截距不同,则可以采⽤在模型中添加虚拟变量的⽅法估计回归参数。 随机效应模型:如果固定效应模型中的截距项包括了截⾯随机误差项和时间随机误差项的平均效应,并且这两个随机误差项都服从正态 分布,则固定效应模型就变成了随机效应模型。 模型的选择:我们经常采⽤F检验决定选⽤混合模型还是固定效应模型,然后⽤Hausman检验确定应该建⽴随机效应模型还是固定效 应模型。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

科研驿站

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值