Lecture 9 面板数据模型
9.1 经济数据结构的分类
截面数据(Cross-sectional data)
时间序列数据(Time-series data)
混合截面数据(Pooled cross sections)
- 不同时期的组间样本个体不同
面板数据(Panel data)
- 不同时期的组间样本个体相同(对相同样本个体跟踪调查)
- 面板数据优点:
- 可以解决样本容量不足的问题,改进模型估计的有效性;
- 有助于更好地分析经济变量之间的关系;
- 可以估计某些难以度量的因素对解释变量的影响。
9.2 三大面板数据模型
One-way(单向效应):只考虑个体效应(individual effect),不考虑时间效应(time effect)。
y i t = β 0 + β 1 x 1 i t + β 2 x 2 i t + ⋯ + β k x k i t + ϵ i t ϵ i t = λ i + u i t y_{it}=\beta_0+\beta_1x_{1it}+\beta_2x_{2it}+\dots+\beta_kx_{kit}+\epsilon_{it}\\ \epsilon_{it}=\lambda_i+u_{it} yit=β0+β1x1it+β2x2it+⋯+βkxkit+ϵitϵit=λi+uit
λ i \lambda_i λi是不可观测的个体效应。固定效应模型和随机效应模型都是非观测效应模型(unobserved effects model)。
固定效应模型(The Fixed Effect Model)
假设
- λ i \lambda_i λi对个体 i i i来说是常数,不随时间变化,但随不同的个体变化
- λ i \lambda_i λi与某个解释变量有关,即允许 C o v ( λ i , x k i t ) ≠ 0 Cov(\lambda_i,x_{kit})\neq0 Cov(λi,xkit)=0
结果:每一个横截面的不同个体具有固定的不同的截距项(因为 λ \lambda λ与解释变量相关,每个个体的解释变量观察值不同,所以不同个体的 λ \lambda λ不同)
固定效应模型估计方法
一阶差分法估计(FD)
固定效应组内变换法(FE)
y i t = β 0 + β 1 x 1 i t + β 2 x 2 i t + ⋯ + β k x k i t + λ i + u i t y_{it}=\beta_0+\beta_1x_{1it}+\beta_2x_{2it}+\dots+\beta_kx_{kit}+\lambda_i+u_{it} yit=β0+β1x1it+β2x2it+⋯+βkxkit+λi+uit
给定一个个体 i i i,将上式两边对时间取平均:
y ‾ i t = β 0 + β 1 x ‾ 1 i + β 2 x ‾ 2 i + ⋯ + β k x ‾ k i + λ i + u ‾ i \overline y_{it}=\beta_0+\beta_1\overline x_{1i}+\beta_2\overline x_{2i}+\dots+\beta_k\overline x_{ki}+\lambda_i+\overline u_i yit=β0+β1x1i+β2x