excel表格虽然看起来lowlow的,但目前的确还是我们一般的数据从业者在工作中最常接触的文件类型。
要知道一套完整的数据分析流程走下来,往往不是一个人的事情,而是多方的对接,这时候一个标准化的通用的数据文件类型就很有必要。换言之,咱不用,但是其它人要用咱也没办法。
既然用,就要用出水平,用出效率。尤其在涉及多个表、多个sheet时,批量处理就很有必要了。
1. 读取数据
(1)一个文件夹下的所有工作簿
setwd(“C:/Users/admin/Desktop/test”)
fileName <- dir()
data.list <-list()
for(i in 1:length(fileName)){
data.list[[i]]=read.xlsx(fileName[i])
}
(2)一个工作簿下的所有工作表
table.list<-list()
for (i in 1:n){
table.list[[i]]=read.xlsx(“POP会员.xlsx”,i)
}
(3)一个文件下所有工作簿下的所有工作表
setwd(“C:/Users/admin/Desktop/test”)
fileName <- dir()
N=length(fileName)
data.list <- list()
n=1
for (i in 1:N) {
for (j in 1:length(excel_sheets(fileName[i]))) {