R语言中data.table包用于处理大数据集(GB级或TB级),但其无法逃掉内存不足的限制,对于电脑内存只有4G或8G的我们来说会把内存撑爆,不知道你有没有这个体验,真是令人头痛,据说ff包的read.table.ffdf()函数可以把TB级的大数据集映射到硬盘,调用ffbase包使用R语言的基础函数来处理这些大数据集,下面来做个简单介绍:
#安装或加载ffbase包会连带安装或加载ff等包
if(!suppressWarnings(require(ffbase))){
install.packages("ffbase")
require(ffbase)
}
#数据读取
data<-read.table.ffdf(x=NULL,#这个要设置,否则会报错,因为初次读取不追加,所以NULL
file = "f:/销售流水整合数据/销售流水2016.csv",#