一个基于os库和pandas的万能数据批量合并脚本

XUAN_MX

于 2023-05-10 11:46:24 发布

阅读量123

点赞数

文章标签： python pandas 数据分析

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_58486836/article/details/130597503

版权


import os
import pandas as pd
f_path=r'I:\工具\无聊编程玩\文件录入合并\data'#外部文件夹地址
f_filelist = os.listdir(f_path)
f_file_n=[]
for f_filename in f_filelist:
    f_filepath = os.path.join(f_path, f_filename)#os包可以提取文件名称，将文件转化为矩阵集
    f_file_n += [f_filepath]#直接提取矩阵集为列表
print("此路径内含有文件夹数量：",len(f_file_n))
print("--完成外部导入,开始批量遍历文件--")
for i in range(len(f_file_n)):
    outputpath=r'{}\group_{}.csv'.format(f_file_n[i],i)#自定义合并表的输出地址和文件名
    path=r'{}'.format(f_file_n[i])#文件所在地址遍历
    filelist = os.listdir(path)
    file_n=[]
    for filename in filelist:
        filepath = os.path.join(path, filename)
        file_n += [filepath]#直接提取矩阵集为列表
    print("此文件夹内含有文件数量：",len(file_n),"遍历文件夹:",i)
    file_r1=r'{}'.format(file_n[0])
    file_1=pd.read_csv(file_r1)#头文件读取
    print("头部文件数据量:",len(file_1))
    count_=[]
    for i in range(1,len(file_n)):#后面就是利用pandas的功能遍历合并
        file_=r'{}'.format(file_n[i])
        file_e=pd.read_csv(file_)
        count_+=[len(file_e)]
        file_1=file_1.append(file_e)
    print("遍历文件计数器：",count_)
    print("最终文件数据量：",len(file_1))
    print("------------------------------------")
    file_1.to_csv(outputpath,sep=',',index=False,header=True)#合并结果输出
print("complete")

最终在批量文件夹中自动生成group_0,~1,~2的合并数据，即如data>0001文件夹中生成的就是Mddyq12和TMddyqALL的数据。理论上data内可以包含任意数量的子目录，子目录中可以包含任意数量的可合并数据。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
一个基于os库和pandas的万能数据批量合并脚本

最终在批量文件夹中自动生成group_0,~1,~2的合并数据，即如data>0001文件夹中生成的就是Mddyq12和TMddyqALL的数据。理论上data内可以包含任意数量的子目录，子目录中可以包含任意数量的可合并数据。
复制链接

扫一扫

XUAN_MX CSDN认证博客专家 CSDN认证企业博客

码龄3年

浙江越秀外国语学院

2: 原创

22万+: 周排名

53万+: 总排名

277: 访问

: 等级

23: 积分

0: 粉丝

0: 获赞

2: 评论

1: 收藏

私信

关注

热门文章

最新评论

UTM地理经纬度向通用平面直角坐标系的投影
CSDN-Ada助手: 很高兴看到你又写了一篇博客！你的文章内容非常有深度，对于地理经纬度向通用平面直角坐标系的投影，你的代码实现也十分精妙。我鼓励你继续写作，分享更多有价值的技术知识。除了你在博客中提到的内容，还有一些扩展知识和技能可以与该主题相关。例如，你可以了解更多的地图投影方法，包括等角投影、等积投影等。此外，你还可以深入了解GIS技术，如何使用ArcGIS等软件进行地理数据的处理和分析。希望这些扩展知识能够对你的学习和写作有所帮助。如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
一个基于os库和pandas的万能数据批量合并脚本
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python

大家在看

最新文章

UTM地理经纬度向通用平面直角坐标系的投影

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。