目录
面板数据(Panel Data)又被称为平行数据,指的是对某变量在一定时间内持续跟踪观测的结果。面板数据兼具了横截面数据和时间序列数据的特点,即有横截面维度(在同一时间段内有多个观测样本),又有时间序列维度(同一样本在多个时间段内被观测到)。面板数据通常样本数量相对较多,也可以有效解决遗漏变量的问题,还可以提供更多样本动态行为的信息,具有横截面数据和时间序列数据无可比拟的优势。根据横截面为度和时间序列维度相对长度的大小,面板数据被区分为长面板数据和短面板数据。
16.1短面板数据分析
短面板数据其主要特征是横截面为度比较大而时间维度相对较小,或者说,同一期间内被观测的个体数量较多而被观测的期间较少。段面板数据分析方法包括直接最小二乘回归分析、固定效应回归分析、随机效应回归分析、组间估计量回归分析等多种。
案例(16.1)A公司是一家销售饮料的连锁公司,下面是销售公司在各省市连锁店2008-2012年的橡树销售数据(包括销售收入、小小费用以及创造利润等数据)。试用短面板数据回归分析方法深入研究销售量和据消费用对制造利润的影响关系。变量包括年份、销售收入、促销费用、创造利润、地区。
encode diqu ,gen(region)
#因为面板数据要求其中的个体变量取值必须为证书而且不允许有重复,所以需要对各个观测样本进行有序编号。本命令旨在讲地区这一字符串变量转化为数值型变量,以便下一步操作
xtest region year
#本命令的含义是对面板数据进行定义,其中横截面为度变量为上步生成的region,时间序列变量为year
可以看出这是一个平衡的面板数据。
xtdes #本命令旨在观测变慢数据的结构,考察面板数据特征,为后续分析做好必要准备
从上图可以看出该面板数据的横截面维度region为1~20共20个取值,时间序列维度year为2008-2012共5个取值,属于短面板数据,而且观测样本在时间上的分布也非常的均匀。
xtsum #本命令旨在现实面板数据组内、组件以及整体的统计指标
上图是面板数据组内、组间以及整体的统计指标的结果。在短面板数据中,同一时间段内的不同观测样本构成一个组。从图中可以看出变量year的组间标准差是0,因为不同组的这一变量取值完全相同,同时变量region的组内标准差也为0,因为分布在同一组的数据属于同一个地区。
xttab sale #本命令旨在现实“sale”变量组内、组间以及整体的分布频率。
xttab cost
xttab profit
上图是sale变量组内、组间以及整体的分布频率的结果。
xtline sale #本命令旨在对每个个体现实“sale”变量的时间序列图
xtline cost
xtline profit
上图是sale的时间序列图,我们可以看到不同地区的销售收入是不一样的有的高有的低,从图中我们还可以看到sale变量在各个地区的时间趋势。
reg profit sale cost #本命令是以profit为因变量,以sale,cost为自变量,进行最小二乘回归分析。