1 需求描述
从指定文件目录下筛选出后缀格式为xlsx的文件,并借助pandas合并文件内容。
2 代码实现
import pandas as pd
def excel_merge():
# ---------文件准备------------ #
filenames = os.listdir(os.getcwd())
writer = pd.ExcelWriter(r'采购成交信息表.xlsx')
excel_files = []
for filename in filenames:
# os.path.splitext()[0]文件名字,[1]后缀格式
if os.path.splitext(filename)[1] == '.xlsx':
excel_files.append(filename)
print(excel_files) # 打印当前目录下所有xlsx文件
# ---------文件合并------------ #
cg_df = []
cj_df = []
for excel_file in excel_files:
cg = pd.read_excel(excel_file, sheet_name='采购信息表', header=None)
# cg = cg.drop([0]) # 删除表头,如报错请检查index
cg_df.append(cg)
cj = pd.read_excel(excel_file, sheet_name='成交信息表', header=None)
# cj = cj.drop([0]) # 删除表头,如报错请检查index
cj_df.append(cj)
# ---------数据另存------------ #
# 写入采购信息
pd.concat(cg_df).to_excel(writer, sheet_name='采购信息表', index=False)
writer.save()
writer.close()
# 写入成交信息
pd.concat(cj_df).to_excel(writer, sheet_name='成交信息表', index=False)
writer.save()
writer.close()