使用Python将文件下多个excel表格合并到一个表里进行数据分析
Python处理excel数据需要用到openpyxl库,该库是是Eric Gazoni和Charlie Clark联合开发,用来处理Excel电子表格的Python第三方库,因此需要在本地安装这个库。
安装命令如下
pip install openpyxl
如需要处理的文件夹下有以下两个excel表格
表格一数据如下
表格二数据如下
合并后效果
如果去除中间重复表头,可以自行在代码中增加该功能
完整代码
import os
from openpyxl import Workbook, load_workbook
# 读取文件路径和合并的新文件名
read_path = r'C:\pythonProject\Test_file'
merge_filename = 'merge_file.xlsx'
# 初始化一个新的工作簿对象
merged_book = Workbook()
merged_sheet = merged_book.active
# 遍历路径下所有xlsx格式文件
for filename in os.listdir(read_path):
if filename.endswith('.xlsx'):
file_path = os.path.join(read_path, filename)
print(f"Scaning file from {file_path}")
# 读取文件中的工作表
file_book = load_workbook(file_path)
file_sheet = file_book.active
#遍历数据行并将他们复制到新的工作表中
for row in file_sheet.iter_rows(values_only=True):
merged_sheet.append(row)
# 将数据保存到新的文件中
merged_book.save(os.path.join(read_path, merge_filename))
print("合并完成")
----------------------------------------------------------------------------
更多精彩内容
|微信长按二维码识别关注|