4_按年份合并词汇数据【“依存句法”之“MD&A分析”】

import os
import pandas as pd

def Merge_excel(folder_path, output_file ,year_time):
    # 获取文件夹中所有Excel文件的路径
    excel_files = [os.path.join(folder_path, f) for f in os.listdir(folder_path) if f.endswith('.xlsx') or f.endswith('.xls')]
    # 初始化一个空的DataFrame,用于存储合并后的数据
    merged_df = pd.DataFrame()
    # 遍历所有Excel文件,逐个加载并合并
    for file in excel_files:
        df = pd.read_excel(file, engine='openpyxl')
        filename = os.path.splitext(file)[0]
        if filename[-10:] == f"{year_time}-12-31": # 判断指定年份,并确定是年末年度报告
            # 如果这是第一个文件,直接将其赋值给merged_df
            if merged_df.empty:
                merged_df = df.copy()
            else:
                # 否则,使用concat方法按照列名合并数据
                # 假设所有文件都有相同的列名,并且你想要保留所有的列
                merged_df = pd.concat([merged_df, df], axis=0, ignore_index=True)
    # 将合并后的DataFrame保存到新的Excel文件
    merged_df.to_excel(output_file, index=False, engine='openpyxl')
    print(f"合并后文件夹被保存为{output_file}")

for time in range(2001,2002):
    # 指定包含Excel文件的文件夹路径
    folder_path = 'C:/Users/86189/Desktop/管理层讨论与分析_词汇'
    # 指定输出文件的名称和路径
    output_file = f'C:/Users/86189/Desktop/管理层讨论与分析_词汇汇总/{time}/{time}_merge.xlsx'
    # 调用函数进行合并
    Merge_excel(folder_path, output_file,time)

  • 11
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值