源码概览
import os
import pandas as pd
frames=[] #新建一个空白列表
def contant_excel(path):
for root,dirs,files in os.walk(path): #os.walk是一个非常强大的方法
for file in files:
df = pd.read_excel(os.path.join(root,file)) #用os.path.join将两个路径拼接
frames.append(df) #将转化的df存入到frames列表中,不然后面的df会覆盖前面的df
result = pd.concat(frames) #pd.concat将frames列表中的df拼接成一个数据集,存入result
result.to_csv(r'D:\工作\业务策略板块\项目\Excel合并\result.csv',sep=',',index=False,encoding="utf_8_sig")
#这里"r'D:\工作\业务策略板块\项目\Excel合并\result.csv'" 也可以用 os.path.join 拼接一下
#添加encoding = "utf_8_sig" 后,打开文件不会乱码。
path = 'D:\工作\业务策略板块\项目\Excel合并\花名册合并'
contant_excel(path)
os.walk是一个非常强大的库,这一点单独拎出来讲讲。
os.walk的语法是
os.walk(top[, topdown=True[, onerror=None[, followlinks=False]]])
top – 是你所要遍历的目录的地址, 返回的是一个三元组(root,dirs,files)。
root 所指的是当前正在遍历的这个文件夹的本身的地址 dirs 是一个 list ,内容是该文件夹中所有的目录的名字(不包括子目录)
files 同样是 list , 内容是该文件夹中所有的文件(不包括子目录) topdown --可选,为 True,则优先遍历 top
目录,否则优先遍历 top 的子目录(默认为开启)。如果 topdown 参数为 True,walk 会遍历top文件夹,与top
文件夹中每一个子目录。onerror – 可选,需要一个 callable 对象,当 walk 需要异常时,会调用。
followlinks – 可选,如果为 True,则会遍历目录下的快捷方式(linux 下是软连接 symbolic link
)实际所指的目录(默认关闭),如果为 False,则优先遍历 top 的子目录。
不过更方便的是使用pathlib模块。