文件目录设置及数据加载
- 文件目录设置
setwd("C:\\Users\\Desktop")#设置工作文件目录
getwd()#获取当前工作文件目录
list.files()#查看当前文件目录中的文件
- 数据加载
1)导入txt文件
data=read.table("文件名.txt",header=T,na.string=c("NA"))
#na.strings = c("NA") 表示文件中的缺失数据都是用NA表示
在读取文本文件时,默认的分割符号为空格。具体的参数设置可参照如下:
read.table(file, header = FALSE, sep = "", quote = "\"'",
dec = ".", numerals = c("allow.loss", "warn.loss", "no.loss"),
row.names, col.names, as.is = !stringsAsFactors,
na.strings = "NA", colClasses = NA, nrows = -1,
skip = 0, check.names = TRUE, fill = !blank.lines.skip,
strip.white = FALSE, blank.lines.skip = TRUE,
comment.char = "#",
allowEscapes = FALSE, flush = FALSE,
stringsAsFactors = default.stringsAsFactors(),
fileEncoding = "", encoding = "unknown", text, skipNul = FALSE)
2)导入CSV数据
data=read.csv("文件名.csv",head=T)#导入CSV数据
3)导入excel数据
·readxl
library(readxl)#加载readxl
data=read_excel("文件名.xlsx")#导入excel文件
View(data)#显示excl文件(*.xls和 *.xlsx 均可以读取)
若不指定sheet 则只会读取excel文件中第一个sheet的数据。
·gdata
install.packages("gdata")
library(gdata)
read.xls("文件名.xls",sheet=1,na.strings=c("NA","#DIV/0!"))
#na.strings=c("NA","#DIV/0!") 将"NA" 和 "#DIV/0!" 都作为缺失数据表示
read.xls()方法只是gdata包中的一个方法,gdata包中还有一些有用的方法,例如xls转csv,xls转txt等,在这里进行一些列举:
xls2csv(xls, sheet=1, verbose=FALSE, blank.lines.skip=TRUE, ..., perl="perl")
xls2tab(xls, sheet=1, verbose=FALSE, blank.lines.skip=TRUE, ..., perl="perl")
xls2tsv(xls, sheet=1, verbose=FALSE, blank.lines.skip=TRUE, ..., perl="perl")
xls2sep(xls, sheet=1, verbose=FALSE, blank.lines.skip=TRUE, ...,
method=c("csv","tsv","tab"), perl="perl")
完