【计量经济学导论】16. 面板数据模型

面板数据模型

经济数据模型

在介绍面板数据之前,我们先回顾一下计量经济学中涉及的各类数据类型。

横截面数据,Cross-sectional Data ,指在特定的时点上,对个人、家庭、企业、城市、省份、国家或一系列其他单位采集的样本所构成的数据集。

  • 通常假定样本是从总体中随机抽样而得到的,常用指标集 i = 1 , 2 , ⋯   , n i=1,2,\cdots,n i=1,2,,n 表示随机样本。
  • 计量分析的结果与数据的排序无关。

时间序列数据,Time-series Data ,指由一个或几个变量不同时间的观测值所构成,或是由同一观测个体在不同时点上所观测的数据构成。

  • 时间序列的数据前后之间具有相关性。
  • 常用时间指标集 t = 1 , 2 , ⋯   , T t=1,2,\cdots,T t=1,2,,T 表示有序样本数据,不满足随机样本的设定。

混合截面数据,Pooled Cross-sections Data ,指既有横截面数据的特点,又有时间序列数据特点的数据。为了扩大样本容量,可以将数据合并成一个混合截面数据。

  • Cross-section 与 Time-series 同时存在,需引入两组指标集 i = 1 , 2 , ⋯   , n i=1,2,\cdots,n i=1,2,,n t = 1 , 2 , ⋯   , T t=1,2,\cdots,T t=1,2,,T 分别表示随机样本和时间序列。
  • 在计量分析过程中,需要引入表示时间变化的虚拟变量以扩大样本容量。
  • 不同时间点上的截面个体可能不一样。
  • 例如:2008年,随机抽取一组家庭针对某些变量做调查;2010年,再随机抽取一组新家庭做调查。

面板数据,Panel Data,指将横截面数据域时间序列数据结合起来的数据,即对横截面中的观测个体在时间上进行连续观测所得到的数据。

  • 不同时点上相同截面个体,即只在第一期做随机抽样,后面都在观察这一组样本的数据。
  • 例如:收集同一组公司不同时点的财务信息。
  • 面板数据通常能够研究决策行为或结果中滞后的重要性,所以反映的信息更有意义。
  • 由于面板数据要求对同一组个体在不同时期进行重复观测,因此面板数据的收集成本更大。

面板数据模型的基本形式

面板数据模型同时包含了截面和时间两个维度,设 i = 1 , 2 , ⋯   , n i=1,2,\cdots,n i=1,2,,n 表示截面个体, t = 1 , 2 , ⋯   , T t=1,2,\cdots,T t=1,2,,T 表示时间。面板数据模型的基本形式为
y i t = f ( x 1 i t , x 2 i t , ⋯   , x k i t ) + u i t   , y_{it}=f(x_{1it},x_{2it},\cdots,x_{kit})+u_{it} \ , yit=f(x1it,x2it,,xkit)+uit ,

模型误差一般可以认为由三部分组成:
u i t = α i + λ t + ε i t   , u_{it}=\alpha_i+\lambda_t+\varepsilon_{it} \ , uit=αi+λt+εit ,
α i \alpha_i αi 表示个体效应、非观测效应、固定效应,表示那些不随时间改变的影响因素,如个人的消费习惯、企业文化、经营风格等。

λ t \lambda_t λt 表示时间效应,用于控制随时间改变的影响,如用于表示技术进步的时间趋势项。

ε i t \varepsilon_{it} εit 表示特异性误差、时变误差,是整个模型的随机误差项。

在这里将 α i \alpha_i αi λ t \lambda_t λt 设定为干扰项,因为 α i \alpha_i αi λ t \lambda_t λt 在多数情况下都是无法直接观测或难以量化的,因此也就无法作为解释变量进入模型。使用截面分析的模型往往会引起遗漏变量的问题。一般地,我们不考虑时间效应,或者说将 λ t \lambda_t λt 的作用并入了 ε i t \varepsilon_{it} εit 中。此时,我们可以设定线性的面板数据模型为
y i t = α i + β 1 x 1 i t + β 2 x 2 i t + ⋯ + β k x k i t + ε i t   . y_{it}=\alpha_i+\beta_1x_{1it}+\beta_2x_{2it}+\cdots+\beta_kx_{kit}+\varepsilon_{it} \ . yit=αi+β1x1it+β2x2it++βkxkit+εit .

其中 α i + ε i t = u i t \alpha_i+\varepsilon_{it}=u_{it} αi+εit=uit ,并且假设 ε i t ∼ N ( 0 ,   σ ε 2 ) \varepsilon_{it}\sim N(0,\,\sigma_{\varepsilon}^2) εitN(0,σε2)

根据 α i \alpha_i αi 的不同状态,我们可以将面板数据模型分为三类:混合回归模型,固定效应模型,随机效应模型。其差异主要反映在对个体效应的处理上。

混合回归模型就是由混合截面数据构成的计量经济学模型。正如我们在经济数据模型中介绍的,这里的混合回归模型严格来说并不属于面板数据模型,它是面板数据模型的一种退化形式。当对所有的截面个体 i i i ,个体效应 α i \alpha_i αi 均相等时,模型退化为混合回归模型。

混合回归模型的基本形式

y i t = α + β 1 x 1 i t + β 2 x 2 i t + ⋯ + β k x k i t + ε i t   . y_{it}=\alpha+\beta_1x_{1it}+\beta_2x_{2it}+\cdots+\beta_kx_{kit}+\varepsilon_{it} \ . yit=α+β1x1it+β2x2it++βkxkit+εit .

i = 1 , 2 , ⋯   , n   ;      t = 1 , 2 , ⋯   , T   . i=1,2,\cdots,n \ ; \ \ \ \ t=1,2,\cdots,T \ . i=1,2,,n ;    t=1,2,,T .

混合回归模型假设所有的横截面个体在各个不同的时期的截距和斜率都是相同的,这样可以直接把面板数据混合在一起,或是直接收集不同时间点上的不同截面个体数据,即混合截面数据。

混合回归模型可以直接用 OLS 方法进行参数估计。

固定效应模型的基本形式

y i t = α i + β 1 x 1 i t + β 2 x 2 i t + ⋯ + β k x k i t + ε i t   . y_{it}=\alpha_i+\beta_1x_{1it}+\beta_2x_{2it}+\cdots+\beta_kx_{kit}+\varepsilon_{it} \ . yit=αi+β1x1it+β2x2it++βkxkit+εit .

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值