R语言快速读取数据方法

我们使用大小为2.2G的一个CSV文件。

一、data.table包下的fread(各种帖子均说此方法最快,我们来比较下)
library(data.table)
start <- Sys.time()
dtc <- fread("C:/Users/10530/Desktop/DTc/DtcDrugTargetInteractions.csv", sep = ",", stringsAsFactors = F, na.strings = "", data.table = T)
end <- Sys.time()
print(end-start)

fread还会有读取进度条, 运行时间1.423824 分
在这里插入图片描述

二、read.方法(这里我们以read.csv函数为例)
start <- Sys.time()
dtc <- read.csv("C:/Users/10530/Desktop/DTc/DtcDrugTargetInteractions.csv", sep = ",", stringsAsFactors = F, na.strings = "")
end <- Sys.time()
print(end-start)

运行时间2.003878 分
在这里插入图片描述

三、有人提到,保存为Rdata之后,在再次导入速度会快很多,我们试试
save(dtc, file = "dtc.Rdata")
start <- Sys.time()
load("dtc.Rdata")
end <- Sys.time()
print(end-start)

运行时间6.042526 秒
在这里插入图片描述

总结,fread确实是初始导入数据最快的方法,不过在导入后的数据,若以.Rdata文件储存,再次导入时,大大节省时间。另外,fread什么都好,就是不能读取excel数据文件。

END


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值