使用 likes <- read.csv(“likes.csv”) 读入CSV文件时,出现无响应,很长时间才能读入CSV文件(R读入CSV应该非常快),读入后字符串数据加引号,如:字符串helloWord,打印输出应该为helloworld,实际输出为“helloworld”。原因:R自动把字符串string的列辨认成factor,而且没有指定列名。
解决办法:
likes <- read.csv(“likes.csv”, header = T, stringsAsFactors=FALSE)
其中,header = T,将读入的第一行指定为列名;stringsAsFactors=FALSE,不将字符串辨认为因子。
结果:读入数据不会出现无响应,且速度很快。
之后,发现这样并没有加载全部数据,还有一个警告没有处理:
Warning message:
In scan(file = file, what = what, sep = sep, quote = quote, dec = dec, :
EOF within quoted string
将读入语句改为:
likes <- read.csv(“likes.csv”,quote = “”,header = T,stringsAsFactors=FALSE)
加载成功。
补充:
1、 likes <- read.csv(“likes.csv”, header = T, stringsAsFactors=FALSE)
2、 likes <- read.csv(“likes.csv”,quote = “”,header = T,stringsAsFactors=FALSE)
使用1,数据没有全部加载。使用2,数据全部加载了,但是数据格式又不对了,读出来的数据加了引号。
最终,使用readr包
print(require(readr))
如果输出为TRUE,则已安装readr,否则安装readr,( 使用语句:install.packages(“readr”) )
之后使用如下语句读取csv文件。
library(readr)
likes <- read_csv(“likes.csv”)
使用dim(likes)查看数据维度,使用head(likes)显示数据头部。数据全部加载且格式正确。