python 面板数据分析_stata面板数据模型分析的详细步骤和命令

最新推荐文章于 2024-07-16 06:27:46 发布

weixin_39524636

最新推荐文章于 2024-07-16 06:27:46 发布

阅读量3.4k

点赞数 3

文章标签： python 面板数据分析

本文链接：https://blog.csdn.net/weixin_39524636/article/details/112833364

版权

stata面板数据模型分析的详细步骤和命令

STATA面板数据模型分析的详细步骤和命令下载地址：

http://vdisk.weibo.com/s/qCPwSw-bb_ovs/1461397835

stata中处理面板数据

第一节关于面板数据PANEL DATA

1、面板数据回归为什么好

一般而言，面板数据模型的误差项由两部分组成，一部分是与个体观察单位有关的，它概括了所有影响被解释变量，但不随时间变化的因素，因此，面板数据模型也常常被成为非观测效应模型；另外一部分概括了因截面因时间而变化的不可观测因素，通常被成为特异性误差或特异扰动项(事实上这第二部分误差还可分成两部分，一部分是不因截面变化但随时间变化的非观测因素对应的误差项Vt，这一部分一般大家的处理办法是通过在模型中引入时间虚拟变量来加以剥离和控制，另一部分才是因截面因时间而变化的不可观测因素。不过一般计量经济学的面板数据分析中都主要讨论两部分，在更高级一点的统计学或计量经济学中会讨论误差分量模型，它一般讨论三部分误差)。

非观测效应模型一般根据对时不变非观测效应的不同假设可分为固定效应模型和随机效应模型。传统上，大家都习惯这样分类：如果把非观测效应看做是各个截面或个体特有的可估计参数，并且不随时间而变化，则模型为固定效应模型；如果把非观测效应看作随机变量，并且符合一个特定的分布，则模型为随机效应模型。

不过，上述定义不是十分严谨，而且一个非常容易让人产生误解的地方是似乎固定效应模型中的非观测效应是随时间不变的，是固定的，而随机效应模型中的非观测效应则不是固定的，而是随时间变化的。

一个逻辑上比较一致和严谨，并且越来越为大家所接受的假设是(参见Wooldridge的教材和Mundlak1978年的论文)，不论固定效应还是随机效应都是随机的，都是概括了那些没有观测到的，不随时间而变化的，但影响被解释变量的因素(尤其当截面个体比较大的时候，这种假设是比较合理的)。非观测效应究竟应假设为固定效应还是随机效应，关键看这部分不随时间变化的非观测效应对应的因素是否与模型中控制的观测到的解释变量相关，如果这个效应与可观测的解释变量不相关，则这个效应成为随机效应。这也正是HAUSMAN设定检验所需要检验的假说。

非观测效应模型因为对非观测效应假设的不同，因为使用面板数据信息的不同，可以用不同方法来估计并且得到不同的估计量，一般有四个：

(1)组内估计量(WITHIN ESTIMATOR)(FE或FD: First Difference)

(2)组间估计量(BETWEEN ESTIMATOR)

(3)混合OLS估计量(POOLED OLS ESTIMATOR)

(4)随机效应估计量(RE，GLS或FGLS估计量)

这四个估计量因为假设和使用信息的不同而不同，各有优劣势，相互之间也有密切关系。3和4分别是1和2的加权平均；4在特定的假设分别可以转化成1和3；如果HAUSMAN检验表明4和1没有区别的时候意味着1和2没有区别。

RE假设未观察因素与解释变量是正交的，只不过在未观察因素里有两个部分，一是

* 此短文适用于对于面板数据和工具变量已经有初步了解的人士，阅读过中级教材的相关内容。本文仅供参考，如果存在错误，请与minglu73@263.net联系，以便及时纠正。请原谅中英文混用。中国科学院的徐志刚博士一一指明了此文存在的错误，并且对原文中存在的不足作了大量的补充，特表示感谢。

与个体单位有关的，二是完全随机的，RE在做估计的时候，是用这两个部分的方差计算出一个指数λ，来做quasi-demean，也就是说在去平均的时候是用原值的y或x减去λ乘以y或x的均值，然后用GLS估计。极端地，当λ为0时，非观测效应是一个常数&