【计量经济学导论】16. 面板数据模型

最新推荐文章于 2025-03-27 16:30:45 发布

这个XD很懒

最新推荐文章于 2025-03-27 16:30:45 发布

阅读量1.5w

点赞数 25

分类专栏：【计量经济学导论】学习笔记

本文链接：https://blog.csdn.net/weixin_45449414/article/details/112593328

版权

文章目录

面板数据模型

面板数据模型

经济数据模型

在介绍面板数据之前，我们先回顾一下计量经济学中涉及的各类数据类型。

横截面数据，Cross-sectional Data ，指在特定的时点上，对个人、家庭、企业、城市、省份、国家或一系列其他单位采集的样本所构成的数据集。

通常假定样本是从总体中随机抽样而得到的，常用指标集 $i=1,2,\cdots,n$ 表示随机样本。
计量分析的结果与数据的排序无关。

时间序列数据，Time-series Data ，指由一个或几个变量不同时间的观测值所构成，或是由同一观测个体在不同时点上所观测的数据构成。

时间序列的数据前后之间具有相关性。
常用时间指标集 $t=1,2,\cdots,T$ 表示有序样本数据，不满足随机样本的设定。

混合截面数据，Pooled Cross-sections Data ，指既有横截面数据的特点，又有时间序列数据特点的数据。为了扩大样本容量，可以将数据合并成一个混合截面数据。

Cross-section 与 Time-series 同时存在，需引入两组指标集 $i=1,2,\cdots,n$ 和 $t=1,2,\cdots,T$ 分别表示随机样本和时间序列。
在计量分析过程中，需要引入表示时间变化的虚拟变量以扩大样本容量。
不同时间点上的截面个体可能不一样。
例如：2008年，随机抽取一组家庭针对某些变量做调查；2010年，再随机抽取一组新家庭做调查。

面板数据，Panel Data，指将横截面数据域时间序列数据结合起来的数据，即对横截面中的观测个体在时间上进行连续观测所得到的数据。

不同时点上相同截面个体，即只在第一期做随机抽样，后面都在观察这一组样本的数据。
例如：收集同一组公司不同时点的财务信息。
面板数据通常能够研究决策行为或结果中滞后的重要性，所以反映的信息更有意义。
由于面板数据要求对同一组个体在不同时期进行重复观测，因此面板数据的收集成本更大。

面板数据模型的基本形式

面板数据模型同时包含了截面和时间两个维度，设 $i=1,2,\cdots,n$ 表示截面个体， $t=1,2,\cdots,T$ 表示时间。面板数据模型的基本形式为
$y_{it}=f(x_{1it},x_{2it},\cdots,x_{kit})+u_{it} \ ,$

模型误差一般可以认为由三部分组成：
$u_{it}=\alpha_i+\lambda_t+\varepsilon_{it} \ ,$
$\alpha_i$ 表示个体效应、非观测效应、固定效应，表示那些不随时间改变的影响因素，如个人的消费习惯、企业文化、经营风格等。

$\lambda_t$ 表示时间效应，用于控制随时间改变的影响，如用于表示技术进步的时间趋势项。

$\varepsilon_{it}$ 表示特异性误差、时变误差，是整个模型的随机误差项。

在这里将 $\alpha_i$ 和 $\lambda_t$ 设定为干扰项，因为 $\alpha_i$ 和 $\lambda_t$ 在多数情况下都是无法直接观测或难以量化的，因此也就无法作为解释变量进入模型。使用截面分析的模型往往会引起遗漏变量的问题。一般地，我们不考虑时间效应，或者说将 $\lambda_t$ 的作用并入了 $\varepsilon_{it}$ 中。此时，我们可以设定线性的面板数据模型为
$y_{it}=\alpha_i+\beta_1x_{1it}+\beta_2x_{2it}+\cdots+\beta_kx_{kit}+\varepsilon_{it} \ .$