利用python将多个格式相同的数据文件合成一个

工作中,我们时常遇到多个数据格式相同的文件,想把它们汇总到一个表中。
例:在’D:\data\数据处理\合并文件‘目录下,有3个数据文件分别为’1.xlsx’, ‘2.xlsx’, ‘3.xlsx’,其里面的表头一样,这时候我们想把他汇总到一个表中。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

1.获取文件名

首先,输入数据存在的路径用以获取该路径下的全部文件。

path = 'D:\data\数据处理\合并文件'
files = os.listdir(path)

输出files,可以见到在此路径下的所有文件。
在这里插入图片描述

2.读取第一个数据文件

之后,读取第一个文件出来,用以作为合并的头个文件。

pd1 = pd.read_excel(path + '\\' + files[0])

pd1输出:
在这里插入图片描述

3.遍历剩下文件合并

然后, 遍历剩下的文件,一个一个跟前面合并。

for i in range(1,len(files)):
    pd2 = pd.read_excel(path + '\\' + files[i])
    pd1 = pd.concat([pd1,pd2])

合并后的pd1输出为:
在这里插入图片描述

4.生成数据文件

最后,生成数据文件,index为数据的索引,一般生成的数据文件不需要列出,因此这里设为’index=None’。

pd1.to_excel('D:\data\数据处理\合并文件\huizong.xlsx',index=None)

可以看到,这里生成了一个huizong.xlsx文件。
在这里插入图片描述
打开此文件,可以看到已经将三个表的数据汇总在一个表中。
在这里插入图片描述

完整代码

import os
import pandas as pd

# 数据存在的路径
path = 'D:\data\数据处理\合并文件'

# 获取路径下的全部文件
files = os.listdir(path)

# 读取第一个文件出来,用以作为合并的头文件
# 这里的'\\',第一个为转义符,'\\'会转义成反斜杠,即'\'
pd1 = pd.read_excel(path + '\\' + files[0])

# 遍历剩下的文件,并合并
for i in range(1,len(files)):
    pd2 = pd.read_excel(path + '\\' + files[i])
    pd1 = pd.concat([pd1,pd2])
    
# 生成数据文件,index为数据的索引,一般生成的数据文件不需要列出,因此这里设为'index=None'
pd1.to_excel('D:\data\数据处理\合并文件\huizong.xlsx',index=None)

  • 1
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值