python 读取多个文本写入同一个excel,每个文本对应各自独立的 sheet 页

刚学习 python ,想试试 excel 导入文本,就查询了资料,写了个脚本;
具体功能是实现将一个目录下的所有文本导入同一个 excel ,每个文本对应各自独立的 sheet 页。
我的操作环境是 Linux,但和 Windows 大体一致。

1. 需要用到的模块

>>>import os
>>>import xlwt
  • os 模块提供了非常丰富的方法用来处理文件和目录,属于默认模块无需下载。
  • xlwt、xlrd 分别是对 excel 表格进行写和读的模块,但这两个模块不能处理 xlsx ;本例仅用到 xlwt 模块。

    如果需要处理 xlsx 文件,则需要用到 openpyxl 模块,而且 openpyxl 可以进行读和写的操作;只是处理时间上稍慢于 xlwt 和 xlrd。(但是随着硬件水平提高,时间将越来越小)

2. 遍历文件夹

首先需要遍历整个文件夹,读取所有文本。其中 filepath 和 xlspath 分别为文件夹路径,以及 xls 的文件路径。

def getline(filepath, xlspath):
	# 读取所有文本
    file_names = os.listdir(filepath)
    # 对os.listdir进行排序 指定参数加上 (key=lambda x:int(x))
    file_names.sort()
    file_ob_list = []
    try:
        # 获取完整目录名并保存到数组
        for file_name in file_names:
            file_ob = filepath + "/" + file_name
            file_ob_list.append(file_ob)
        print(file_ob_list)	#测试输出所有的数组
2.1 读取文件并排序

这里需要用到 os.listdir(path) ,它的作用是返回path指定的文件夹包含的文件或文件夹的名字的列表。

    >>> import os
    >>> file_names = os.listdir('.')
    >>> print(file_names)
    ['3.txt', '9.txt', '10.txt', '2.txt', '1.txt', '20.txt']
  • 但是我发现 os.listdir() 处理后是一个乱序数组,需要进行排序,如果需要指定特定符号排序,可以用 (key=lambda x:int(x)) ,详细可以百度一下。
	>>> file_names.sort()
	
  • 11
    点赞
  • 42
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
你可以使用 Python 中的 pandas 库来读取同一文件夹下的多个 Excel 文件,并从中提取需要的数据,然后将这些数据写入一个新的 Excel 文件。下面是一个示例代码: ```python import os import pandas as pd # 设置文件夹路径 folder_path = '/path/to/folder' # 获取文件夹中所有的 Excel 文件 excel_files = [f for f in os.listdir(folder_path) if f.endswith('.xlsx')] # 创建一个空的 DataFrame 用于存储所有数据 data = pd.DataFrame() # 循环遍历每个 Excel 文件,提取需要的数据 for file in excel_files: file_path = os.path.join(folder_path, file) df = pd.read_excel(file_path, sheet_name='Sheet1') # 提取第一列和第三列的数据,并将它们合并到 data DataFrame 中 data = pd.concat([data, df.iloc[:, [0, 2]]], axis=0) # 将 data 中的数据写入一个新的 Excel 文件 output_file = '/path/to/output.xlsx' data.to_excel(output_file, index=False) ``` 在这个示例代码中,我们首先设置了文件夹路径并获取了所有的 Excel 文件。接下来,我们循环遍历每个 Excel 文件,使用 pandas 库的 read_excel() 函数读取每个文件中的数据。在这个示例中,我们假设数据位于每个 Excel 文件的第一张工作表 (Sheet1) 中,并且我们需要提取每个文件中的第一列和第三列的数据。我们使用 iloc 属性来选择需要的列,并将它们合并到一个名为 data 的 DataFrame 中。最后,我们将 data 中的数据写入一个新的 Excel 文件,这个文件的路径是 '/path/to/output.xlsx'。 注意,在这个示例中,我们使用了 concat() 函数将每个 Excel 文件中提取的数据合并到一个 DataFrame 中。在实际应用中,你可能需要根据数据的特点来选择合适的合并方法,例如使用 merge() 函数或 join() 函数。此外,在写入新的 Excel 文件时,你可以使用 to_excel() 函数来指定需要写入的工作表名称,例如 data.to_excel(output_file, sheet_name='Sheet1')。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值