R语言1-面板数据分析全过程附代码

最新推荐文章于 2025-02-08 15:55:48 发布

Christineagr

最新推荐文章于 2025-02-08 15:55:48 发布

阅读量1.6w

点赞数 20

分类专栏： r语言计量经济学文章标签： r语言统计模型

本文链接：https://blog.csdn.net/Christineagr/article/details/106439226

版权

R语言1-面板数据分析全过程附代码

用途

面板数据常见于计量经济学领域，本质上是一种线性回归方法。截面数据和时间序列数据的组合可以更多的反应数据情况，同时也需要克服二者都存在的问题。

数据初步处理

在Excel中将原数据进行初步处理和排列并另存为csv格式，建议将文件存放于便于提取的路径下。
因变量为export.value，自变量分别为gdp、sagr、iagr、tagr、gni.p、food…其中apec和close是哑变量。截面为27个国家，时间跨度为2001-2018年。

数据清洗

在现实的经济数据中，数据不可避免的会存在缺失等问题。因此需要对数据进行清洗，并对缺失数据集进行插补。插补方法较多，R为面板数据提供了专门的程辑包：pan包。
首先进行缺失数据的可视化，然后针对缺失数据集进行插补。注意因变量应该是完整的，pan包主要是处理自变量的缺失。
详细的插补步骤和方法请参考这篇博文

面板数据的单位根检验

// 读取数据
lndataI<-read.csv("E://lndataI.csv",header = TRUE);
lnDATAI<-as.matrix(lndataI[,3:15])
//加载程辑包
library(plm)
//matrix形式简化检验步骤
purtest(lnDATAI,test = c("levinlin"),exo = c("trend"),lags = c("AIC"),pmax = 10)
//可选参数
test = c("levinlin", "ips", "madwu", "Pm", "invnormal", "logit", "hadri"),
exo = c