作者:Economicoder
微信公众号:数据学徒
本文以2000年度工业企业数据库为例,该Excel表格包含约16万条记录,文件有88M这么大。如果尝试用Stata直接打开,则会出现如下提示。
不难发现,Stata可以读取小于40M的Excel文件,当Excel文件较大时便会报错。这就好比传控足球固然美丽,但是面对摆大巴的球队无能为力。
破大巴需要攻城锤,R语言挺身而出,敲开大型Excel文件之门。
library(openxlsx)
library(foreign)
x = read.xlsx('2000.xlsx',1) # 读取 Excel 的 Sheet1
# View(x)
write.dta(x, '2000.dta') # 输出为 Stata 能读取的格式
在RStudio中运行如上代码,等待2分钟,便可获得dta后缀名文件,可用Stata顺利打开。