一、xlsx包里的read.xlsx()和read.xlsx2(),以dataframe格式读入,二者的区别是read.xlsx2()读取数据量的大(超过100 000个单元格)的表格更快。xlsx包是一个基于java的R包,需要配置好相应的java环境。
read.xlsx(
xlsxFile,#支持"xls"和"xlsx"文件
sheetIndex = 1,#工作表序号。
sheetName = NULL,#工作表名称。
rowIndex = NULL,#默认查找全部行的数据。
startRow = NULL,#默认从第一行开始查找数据。
endRow = NULL,#默认到查找数据到最后一行。
colIndex = NULL,#默认查找全部列的数据。
as.data.frame = TRUE,#默认转成dataframe。
header = TRUE,#默认读取第一行为列名。
colClasses = NA,#可以指定每一列的变量类型,包括numeric, character, Date, POSIXct。NA表示通过第一行的数据来猜测数据的格式。
keepFormulas = FALSE,#默认不保留数据中的公式。
encoding = "unknown",#默认不指定编码。
password = NULL#默认excel未设置密码。
)
相应的,导出数据的函数也有两个,分别是write.xlsx()和write.xlsx2()。
write.xlsx(
x,#需要导出的数据框
file,#到出文件的路径
sheetName = "Sheet1",#导出后生成表格(sheet)的名称,默认为Sheet1