实证分析——以上海区级医院和社区卫生服务中心医生分布为例
面板数据模型建立过程遵循三个步骤。
首先,通过单位根检验,检验各面板数据序列的平稳性,以避免伪回归。
第二,开展协整检验或模型修正,防止出现伪回归问题。
第三,在前两步的基础上,进行模型设定检验,以确定选用哪一种面板数据模型。
3.1.2 面板数据模型的基本理论
面板数据模型的一般形式
面板数据模型的一般模型如下:
其中,i表示个体,t表示时间。横截面的个数为N,时间序列的维数为T。γit是被解释变量的第i个个体的第t时期观测值,χkit是第k个解释变量的第i个个体第t时期的观测值,βki是待估计参数,uit为随机误差项。用矩阵形式表示为
混合回归模型
混合回归模型是将面板数据混合在一起采用普通最小二乘法进行参数估计的面板数据模型,主要应用于不同个体在时间上不存在显著差异并且在不同截面之间也不存在显著差异的情况,即混合回归模型建立在解释变量对被解释变量的影响与个体无关的假设基础之上,这种模型在实际问题的研究当中应用较少。模型用公式表示为
用矩阵形式表示为
固定效应模型
固定效应模型是指斜率系数相同,而截距存在一定差异的模型。固定效应模型按截距的不同形式可以分为三种类型:个体固定效应模型、时间固定效应模型和时间个体固定效应模型。
固定效应模型一般采用LSDV估计法(The Least Sauare Dummy Variable Estimation)或者是ANCOVA估计法(The Analysis of Covariance Estimation)进行参数估计。
(1)个体固定效应模型
个体固定效应模型是指斜率系数相同而不同纵剖面(个体)截距不同的模型。用公式表示为
写成矩阵形式为
(2)时间固定效应模型
时间固定效应模型是指斜率系数相同而横剖面(时间点)截距不同的模型。用公式表示为
(3)时间个体固定效应模型
时间个体固定效应模型是指斜率相同而纵剖面(个体)和横剖面(时间点)都具有不同截距的模型。用公式表示为
随机效应模型
由于解释被解释变量的信息不够充分,固定效应模型往往通过设定虚拟变量来反映个体特征或者时间特征,或者是通过对模型截距项进行分解。但是固定效应模型存在一些不足,如固定效应模型是建立在一定的假设基础之上的。而实际情况并不能满足,并且虚拟变量的存在大大降低了模型的自由度,固定效应模型只考虑了确定性信息的效应,对于随机信息的效应未能得到有效考虑。随机效应模型可以在一定程度上弥补固定效应模型的这种不足。
随机效应模型将混合回归模型的随机误差项进行了分解,将其分解为三个部分:uit=ui&#