三种数据类型
- 横截面数据:特定的时间点对若干个体采集的样本所构成的数据集。
- 时间序列数据:同一个个体在不同时间点上所观测的数据构成的数据集。
- 面板数据:横截面数据与时间序列数据的结合,对横截面中的观测个体在时间上进行连续观测所得到的数据。
面板数据模型的基本形式:
y i t = f ( x 1 i t , x 2 i t , ⋯ , x k i t ) + u i t y_{it} = f(x_{1it},x_{2it},\cdots,x_{kit}) + u_{it} yit=f(x1it,x2it,⋯,xkit)+uit
i = 1 , 2 , ⋯ , n i=1,2,\cdots,n i=1,2,⋯,n表示个体数量, t = 1 , 2 , ⋯ , T t=1,2,\cdots,T t=1,2,⋯,T表示观测时间点, k k k表解释变量的个数。
模型误差拆解:
u i t = α i + λ t + ϵ i t u_{it}=\alpha_i+\lambda_t + \epsilon_{it} uit=αi+λt+ϵit
-
α i \alpha_i αi表示个性效应
-
λ i \lambda_i λi表示时间效应
-
ϵ i t \epsilon_{it} ϵit表示随机误差
我们采用线性模型,并假设:
- ϵ i t ∼ N ( 0 , σ ϵ 2 ) \epsilon_{it}\sim N(0,\sigma^2_{\epsilon}) ϵit∼N(0,σϵ2)
- 不考虑时间效应
得到
y i t = α i + β 1 x 1 i t + β 2 x 2 i t + ⋯ + β k x k x t + ϵ i t y_{it}=\alpha_i + \beta_1x_{1it} + \beta_2x_{2it} +\cdots+ \beta_kx_{kxt}+\epsilon_{it} yit=αi+β1x1it+β2x2it+⋯+βkxkxt+ϵit
三种建模方式
- 混合回归模型:个体效应相同, α i = α , i = 1 , 2 , ⋯ , n \alpha_i = \alpha,i=1,2,\cdots,n αi=α,i=1,2,⋯,n
- 固定效应模型:个体效应不同,且 α i , i = 1 , 2 , ⋯ , n \alpha_i,i=1,2,\cdots,n αi,i=1,2,⋯,n是常数
- 随机效应模型: α i \alpha_i αi是随机变量
随机效应模型具有两个随机误差项 α i \alpha_i αi和 ϵ i t \epsilon_{it} ϵit,我们假设满足 E ( α i ) = α , α i = α + v i , v i E(\alpha_i) = \alpha,\alpha_i=\alpha + v_i,v_i E(αi)=α,αi=α+vi,vi是随机变量,并对随机误差项的方差结构提出一些假设.
简单两层分层线性模型
Y i j = β 0 j + β 1 j X i j + r i j Y_{ij} = \beta_{0j}+\beta_{1j}X_{ij}+r_{ij} Yij=β0j+β1jXij+rij 层1模型
β 0 j = γ 00 + γ 01 W j + μ 0 j \beta_{0j}=\gamma_{00}+\gamma_{01}W_j+\mu_{0j} β0j=γ00+γ01Wj+μ0j 层2模型
β 1 j = γ 10 + γ 11 W j + μ 1 j \beta_{1j}=\gamma_{10}+\gamma_{11}W_j+\mu_{1j} β1j=γ10+γ11Wj+μ1j
Y i j = γ 00 + γ 10 X i j + γ 01 W j + γ 11 X i j W j + μ 0 j + μ 1 j X i j + r i j Y_{ij}=\gamma_{00}+\gamma_{10}X_{ij}+\gamma_{01}W_j+\gamma_{11}X_{ij}W_j+\mu_{0j}+\mu_{1j}X_{ij}+r_{ij} Yij=γ00+γ10Xij+γ01Wj+γ11XijWj+μ0j+μ1jXij+rij
- 直接对层2模型的参数进行估计不可行,因为结果 β 0 j 、 β 1 j \beta_{0j}、\beta_{1j} β0j、β1j未能直接观察
- 组合形式不满足典型线性模型的假设
一般模型的简单子模型
- 单因素随机效应方差分析模型: Y i j = γ 00 + μ 0 j + r i j Y_{ij}=\gamma_{00}+\mu_{0j}+r_{ij} Yij=γ00+μ0j+rij
- 随机截距模型
- 将平均数作为结果的回归模型
- 单因素随机效应协方差分析模型
- 随机系数回归模型