Python pandas库_文件汇总

銘呀銘呀銘呀

已于 2022-11-08 16:39:54 修改

阅读量303

点赞数

文章标签： python pandas 数据分析

于 2022-11-08 16:32:09 首次发布

本文链接：https://blog.csdn.net/weixin_62372757/article/details/127752982

版权

读取文件夹文件>>循环读取文件内容>>按行合并

concat函数基础解释

读取文件夹文件>>循环读取文件内容>>按行合并

我希望通过pandas库，实现程序代替重复性的复制粘贴

# 导入系统自带的os 模块和数据分析所用pandas模块
import os
import pandas as pd

#赋值文件夹路径
path = ''

excels = [] 
for file in os.listdir(path):
    # print(file)   能够正常读取文件夹内的文件名称
#判断文件是否是xlsx文件，可根据需要换成'xls'，因为'xls'和'xlsx'，都包含了'xls'
    if 'xlsx' in file:
        excels.append(pd.read_excel(path+file))
        # print(pd.read_excel(path+file))

#pandas中concat方法，无其它参数下只增加行数（解释见下文）
df = pd.concat(excels)

# 新生成文件存入py文件同目录下
df.to_excel('./汇总.xlsx',index=False)

concat函数基础解释

默认条件下的concat函数不会去重，也不会因为少一列报错，会添加进所有文件所有不重复列名，没有相应列名的文件录入区域为空值，所以适合制式表格。没有统一格式的表合并需慎重！

tips:关于concat函数的更多进阶，可以去看其他同学的分享哈

銘呀銘呀銘呀

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
Python pandas库_文件汇总

默认条件下的concat函数不会去重，也不会因为少一列报错，会添加进所有文件所有不重复列名，没有相应列名的文件录入区域为空值，所以适合制式表格。没有统一格式的表合并需慎重！tips:关于concat函数的更多进阶，可以去看其他同学的分享哈。
复制链接

扫一扫