import os
import pandas as pd
from datetime import datetime
# 指定包含Excel文件的文件夹路径
folder_path = 'C:/Users/Desktop/new_2023'
# 获取文件夹中的所有文件名
file_names = os.listdir(folder_path)
# 创建一个空的DataFrame用于存储合并后的数据
merged_data = pd.DataFrame()
# 遍历文件夹中的所有文件
for file_name in file_names:
# 仅处理Excel文件
if file_name.endswith('.xlsx') or file_name.endswith('.xls') or file_name.endswith('.XLS'):
# 构建文件的完整路径
file_path = os.path.join(folder_path, file_name)
# 读取Excel文件的内容
try:
excel_data = pd.read_excel(file_path)
# 将读取的数据添加到合并后的DataFrame中
merged_data = merged_data._append(excel_data, ignore_index=True)
except Exception as e:
print(f"Error reading file: {file_path}")
print(str(e))
# 删除滑入(QAR)列为合计的行
merged_data = merged_data[merged_data["滑入(QAR)"] != "合计"]
# 删除第一列
merged_data = merged_data.drop(merged_data.columns[0], axis=1)
# 筛选数据,修改限定的日期范围
merged_data['航班日期'] = pd.to_datetime(merged_data['航班日期'])
df = merged_data[merged_data["航班日期"] > datetime(2023, 5, 31)]
# 保存合并后的数据到新的Excel文件中
output_path = 'C:/Users/Desktop/new2023copy.xlsx'
df.to_excel(output_path, index=False)
print("Data merged and saved successfully.")
python 合并文件夹下的多个excel表格
最新推荐文章于 2024-09-18 11:30:55 发布