获取- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
访问数据库
install.packages("RODBC")
install.packages("RMYSQL")
读取- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
查看文件头尾,num是一次显示的行号
head(x, n= num)
tail(x, n= num)
参数
header = TRUE/FALSE 是否把第一行设置为变量名称而非值
skip = num 跳过前n行信息
nrows = num 只读取文件前num行
na.strings = 把缺失值替换为R的NA
stringsAsFactors = TRUE/FALSE 是否把字符串转化为因子
txt
read.table(input.txt)
csv
read.table("input.csv", sep = ",")
read.csv("input.csv")
XLS,XLSX
用XLConnect包
Library(XLConnect)
#两步法
ex <- loadWorkbook("file_name.xlsx")
readWorksheet(ex, num) #num为工作表的编号
#一步法
wb<- LoadWorkbook("file.xlsx",create = T)
xlxs
library(xlsx)
read.xlsx("data.xlsx",1)
网页
网页中的文件
x <- read.table("https://website")
网页中的表格
library(XML)
readHTMLTable("https://website",which = 3) #读取website网页中的第三张表
外部(Minitab, S, SAS,SPSS,Stata,Systat,Weka, dBase等)
library("foreign")
剪切板
read.table("clipboard", header = T, sep = "\t")
readClipboard()
压缩格式 (gz,zip...)
read.table(gzfile("input.txt.gz")
不规则?文件
总之除了上述的也会有不规则的文件,到时候具体用具体查好了喵
readLines(“input.csv", n = num) #按行读取,num为读取的最大行数
scan()
RDS
对存储为内部文件格式的数据进行自动压缩处理,并且会存储所有与带存储对象相关的R源数据。如果数据中包含了因子,日期和时间或者类的属性等信息
Rdata
其实类似于其他软件中的项目文件...
load(filename.Rdata)
当然也可以通过点击直接加载
写 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
参数
na 调整默认缺失值
append 是否追加写入,否则清空原文件
txt
write.table(x, file = "file_name.txt")
csv
write.table(x, file = "file_name.csv", sep = ",") #这种会把行号也给你写进去,所以一般不用
write.table(x, file = "file_name.csv", sep = ",", row,names = FALSE) 不加行号版
write.csv
XLS,XLSX
XLConnect
Library(XLConnect)
#三步法
createSheet(wb, "sheet1") #在工作簿中创造工作表
writeWorksheet(wb, data = data_name, sheet = "sheet1") #将数据保存到工作表中
saveWorkbook(wb)
#一步法
writeWorksheetToFile("file1.xlsx", data = iris, sheet = "sheet1")
xlxs
library(xlsx)
read.xlsx(x, file = "data.xlsx", sheetName = "Sheet 1")
RDS
saveRDS(data, file = "file_name.RDS")
Rdata
save(data, file = "filename.Rdata")
压缩格式 (gz,zip...)
write.table(x, gzfile())