工作中遇到了这样的需求:从多个分公司/部门做一项调查或统计,总部下发模板,分部填好后反馈,然后汇总所有表格。
但是有的因为需要反馈文件数量比较多,分布在很多个文件夹内,而且除了需要汇总的表格外还有其他的表和文本。
脚本内容如下
import os
import pandas as pd
# 将excel文件读取出来放一个列表里面
dirpath = r'D:\工作\上报' # 获取系统文件目录
# 新建列表,存放文件名
file_list = []
# 新建列表存放每个文件数据(依次读取多个相同结构的Excel文件并创建DataFrame)
dfs = []
for root,dirs,files in os.walk(dirpath):
# 第一个为起始路径,第二个为起始路径下的文件夹,第三个是起始路径下的文件
for