目录
读取文件夹文件>>循环读取文件内容>>按行合并
读取文件夹文件>>循环读取文件内容>>按行合并
我希望通过pandas库,实现程序代替重复性的复制粘贴
# 导入系统自带的os 模块和数据分析所用pandas模块
import os
import pandas as pd
#赋值文件夹路径
path = ''
excels = []
for file in os.listdir(path):
# print(file) 能够正常读取文件夹内的文件名称
#判断文件是否是xlsx文件,可根据需要换成'xls',因为'xls'和'xlsx',都包含了'xls'
if 'xlsx' in file:
excels.append(pd.read_excel(path+file))
# print(pd.read_excel(path+file))
#pandas中concat方法,无其它参数下只增加行数(解释见下文)
df = pd.concat(excels)
# 新生成文件存入py文件同目录下
df.to_excel('./汇总.xlsx',index=False)
concat函数基础解释
默认条件下的concat函数不会去重,也不会因为少一列报错,会添加进所有文件所有不重复列名,没有相应列名的文件录入区域为空值,所以适合制式表格。没有统一格式的表合并需慎重!
tips:关于concat函数的更多进阶,可以去看其他同学的分享哈