一个一个打开复制粘贴固然可行,但是该方法费时费力,还容易出错,几个文件还可以手动处理,要是几十个甚至上百个,你就抓瞎了,不过这问题对Python来说,so easy,一起来看看吧!
二、项目目标
用Python实现多Excel、多Sheet的合并处理。
三、项目准备
软件:PyCharm
需要的库:pandas, xlrd,os
四、项目分析
1)如何选择要合并的Excel文件?
利用os,获取所有要合并的Excel文件。
2)如何选择要合并的Sheet?
利用xlrd库进行Excel读取,获取要合并的Sheet名。
3)如何合并?
利用pandas库,对所有Sheet名逐一循环打开,通过concat()进行数据追加合并即可。
4)如何保存文件?
利用to_excel保存数据,得到最终合并后的目标文件。
五、项目实现
1、第一步导入需要的库
import pandas as pd import xlrd import os
2、第二步选择要合并的Excel文件
#要合并文件路径 path="D:/b/" #获取文件夹下所有EXCEL名 xlsx_names = [x for x in os.listdir(path) if x.endswith(".xlsx")
3、第三步选择要合并的Sheet
# 获取第一个EXCEL名 xlsx_names1 = xlsx_names[0] aa = path + xlsx_names1 #打开第一个EXCEL first_file_fh=xlrd.open_workbook(aa) # 获取SHEET名 first_file_sheet=first_file_fh.sheets()
4、第四步对Sheet内容进行循环合并
#按SHEET名循环 for sheet_name in sheet_names: df = None # 按EXCEL名循环 for xlsx_name in xlsx_names: sheet_na = pd.ExcelFile(path +