R语言快速读取数据方法_rstudio用fread读取进度条-CSDN博客

本文链接：https://blog.csdn.net/zdx1996/article/details/87893315

我们使用大小为2.2G的一个CSV文件。

一、data.table包下的fread（各种帖子均说此方法最快，我们来比较下）

library(data.table)
start <- Sys.time()
dtc <- fread("C:/Users/10530/Desktop/DTc/DtcDrugTargetInteractions.csv", sep = ",", stringsAsFactors = F, na.strings = "", data.table = T)
end <- Sys.time()
print(end-start)

fread还会有读取进度条, 运行时间1.423824 分
在这里插入图片描述

二、read.方法（这里我们以read.csv函数为例）

start <- Sys.time()
dtc <- read.csv("C:/Users/10530/Desktop/DTc/DtcDrugTargetInteractions.csv", sep = ",", stringsAsFactors = F, na.strings = "")
end <- Sys.time()
print(end-start)

运行时间2.003878 分
在这里插入图片描述

三、有人提到，保存为Rdata之后，在再次导入速度会快很多，我们试试

save(dtc, file = "dtc.Rdata")
start <- Sys.time()
load("dtc.Rdata")
end <- Sys.time()
print(end-start)

运行时间6.042526 秒
在这里插入图片描述

R语言快速读取数据方法

一、data.table包下的fread（各种帖子均说此方法最快，我们来比较下）

二、read.方法（这里我们以read.csv函数为例）

三、有人提到，保存为Rdata之后，在再次导入速度会快很多，我们试试

总结，fread确实是初始导入数据最快的方法，不过在导入后的数据，若以.Rdata文件储存，再次导入时，大大节省时间。另外，fread什么都好，就是不能读取excel数据文件。

END