从指定文件夹下很多个excel中读取指定内容,并合并成一个表,再增加字段

注册csdn十多年了,之前都是偷师学艺,工作中用excel比较多,最近开始使用python,主要是想结合excel做点小工具,提高工作效率,顺便记录一下学习历程。 从D:\XXX\YYY中的所有excel中读取AAA右边第一个单元格和BBB右边第三个单元格的内容,将AAA表头修改为aaa,将BBB列名修改为bbb,增加ccc/ddd/eee三个空列,将结果输出到D:\ZZZ目录下面...
摘要由CSDN通过智能技术生成

注册csdn十多年了,之前都是偷师学艺,工作中用excel比较多,最近开始使用python,主要是想结合excel做点小工具,提高工作效率,顺便记录一下学习历程。

 

    从D:\XXX\YYY中的所有excel中读取AAA右边第一个单元格和BBB右边第三个单元格的内容,将AAA表头修改为aaa,将BBB列名修改为bbb,增加ccc/ddd/eee三个空列,将结果输出到D:\ZZZ目录下面,以便在excel中编辑

1.YYY中有很多excel文件,但是都包含AAA和BBB,需要读取AAA和BBB旁边单元格的内容

假如有两个文件

文件1:

…… …… ……
AAA 123 ……
BBB 345
  • 2
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
你可以使用 Python 的 pandas 库来读取同一文件夹下的多个 Excel 文件,并从提取需要的数据,然后将这些数据写入一个新的 Excel 文件。下面是一个示例代码: ```python import os import pandas as pd # 设置文件夹路径 folder_path = '/path/to/folder' # 获取文件夹所有的 Excel 文件 excel_files = [f for f in os.listdir(folder_path) if f.endswith('.xlsx')] # 创建一个空的 DataFrame 用于存储所有数据 data = pd.DataFrame() # 循环遍历每个 Excel 文件,提取需要的数据 for file in excel_files: file_path = os.path.join(folder_path, file) df = pd.read_excel(file_path, sheet_name='Sheet1') # 提取第一和第三数据,并将它们合并到 data DataFrame data = pd.concat([data, df.iloc[:, [0, 2]]], axis=0) # 将 data 数据写入一个新的 Excel 文件 output_file = '/path/to/output.xlsx' data.to_excel(output_file, index=False) ``` 在这个示例代码,我们首先设置了文件夹路径并获取了所有的 Excel 文件。接下来,我们循环遍历每个 Excel 文件,使用 pandas 库的 read_excel() 函数读取每个文件数据。在这个示例,我们假设数据位于每个 Excel 文件的第一张工作 (Sheet1) ,并且我们需要提取每个文件的第一和第三数据。我们使用 iloc 属性来选择需要的,并将它们合并一个名为 data 的 DataFrame 。最后,我们将 data 数据写入一个新的 Excel 文件,这个文件的路径是 '/path/to/output.xlsx'。 注意,在这个示例,我们使用了 concat() 函数将每个 Excel 文件提取的数据合并一个 DataFrame 。在实际应用,你可能需要根据数据的特点来选择合适的合并方法,例如使用 merge() 函数或 join() 函数。此外,在写入新的 Excel 文件时,你可以使用 to_excel() 函数来指定需要写入的工作名称,例如 data.to_excel(output_file, sheet_name='Sheet1')。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值