R语言1-面板数据分析全过程 附代码
用途
面板数据常见于计量经济学领域,本质上是一种线性回归方法。截面数据和时间序列数据的组合可以更多的反应数据情况,同时也需要克服二者都存在的问题。
数据初步处理
在Excel中将原数据进行初步处理和排列并另存为csv格式,建议将文件存放于便于提取的路径下。
因变量为export.value,自变量分别为gdp、sagr、iagr、tagr、gni.p、food…其中apec和close是哑变量。截面为27个国家,时间跨度为2001-2018年。
数据清洗
在现实的经济数据中,数据不可避免的会存在缺失等问题。因此需要对数据进行清洗,并对缺失数据集进行插补。插补方法较多,R为面板数据提供了专门的程辑包:pan包。
首先进行缺失数据的可视化,然后针对缺失数据集进行插补。注意因变量应该是完整的,pan包主要是处理自变量的缺失。
详细的插补步骤和方法请参考这篇博文
面板数据的单位根检验
// 读取数据
lndataI<-read.csv("E://lndataI.csv",header = TRUE);
lnDATAI<-as.matrix(lndataI[,3:15])
//加载程辑包
library(plm)
//matrix形式简化检验步骤
purtest(lnDATAI,test = c("levinlin"),exo = c("trend"),lags = c("AIC"),pmax = 10)
//可选参数
test = c("levinlin", "ips", "madwu", "Pm", "invnormal", "logit", "hadri"),
exo = c