pandas对每十行做批量操作_pandas批量处理同类型文件

在平时工作中,我们的很多任务基本都是重复的操作过程,比如平时相同类型Excel表格的处理过程。我们现在做一个假想,如果有一个类型这样的表格,我们直接手动处理就很快了,那么如果同样的还是只有一个这样的文件,但是这个文件下有多个不同的Sheet,每个Sheet里面的内容格式又是相同的,这样我们就得一步一步的合并表格数据了,我们继续深入,如果有很多个这样的文件,而每个文件下面又有很多个Sheet,那么我...
摘要由CSDN通过智能技术生成

在平时工作中,我们的很多任务基本都是重复的操作过程,比如平时相同类型Excel表格的处理过程。我们现在做一个假想,如果有一个类型这样的表格,我们直接手动处理就很快了,那么如果同样的还是只有一个这样的文件,但是这个文件下有多个不同的Sheet,每个Sheet里面的内容格式又是相同的,这样我们就得一步一步的合并表格数据了,我们继续深入,如果有很多个这样的文件,而每个文件下面又有很多个Sheet,那么我们合并表格过程是不是异常的复杂,还容易漏掉,这个时候我们就要想着用代码的思路处理这些文件,可以极大的加大做事效率。恰好,python的pandas库提供了我们一个简单的方法,接下来,我将以实际案例来告诉大家怎么做这个过程。我们的思路就是①将一个文件下的多个Sheet合并到一起②将多个文件的多个不同Sheet表合并成一个文件③批量处理合并好的文件。

①将一个文件下的多个Sheet合并到一起

如上图我们在一个文件夹中有4个文件,这些文件的类型相同,即里面的字段相同,然后每个文件下面又有几个不同的Sheet。然后我们的目标便是把几个不同的Sheet文件合并到一起,然后再批量处理。那么我们先实现读取任意一个文件,然后把这个文件的所有Sheet内容合并到一起。

我就拿1.xlsx这个文件为例子,具体代码实现如下:

import pandas as pd

# 创建空表格 用于存储

ov_xlsx = pd.DataFrame()

# 读取文件

data_xls = pd.ExcelFile('C:/Users/Administrator/Desktop/待处理数据/1.xlsx')

# 获取文件下对应的sheet名

print(data_xls.sheet_names)

# 遍历获取的sheet名,然后读取每个sheet

for name in data_xls.sheet_names:

df = pd.read_excel('C:/Users/Administrator/Desktop/待处理数据/1.xlsx', name, index=False,dtype=object)

# 将每次读取的文件内容都加入到ov_xlsx这个新表里

ov_xlsx = ov_xlsx.append(df, ignore_index=True)

#保存数据到指定的位置

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值