【高效办公】文件夹中的所有excel合并，os和pandas模块

最新推荐文章于 2022-01-30 18:04:13 发布

於陵樺暉

最新推荐文章于 2022-01-30 18:04:13 发布

阅读量229

点赞数

分类专栏：数据分析

本文链接：https://blog.csdn.net/wyh33200/article/details/104963095

版权

数据分析专栏收录该内容

3 篇文章 0 订阅

订阅专栏

源码概览

import os
import pandas as pd

frames=[]		#新建一个空白列表

def contant_excel(path):
    for root,dirs,files in os.walk(path):		#os.walk是一个非常强大的方法
        for file in files:
            df = pd.read_excel(os.path.join(root,file))		#用os.path.join将两个路径拼接
            frames.append(df)		#将转化的df存入到frames列表中，不然后面的df会覆盖前面的df
    result = pd.concat(frames)		#pd.concat将frames列表中的df拼接成一个数据集，存入result
    result.to_csv(r'D:\工作\业务策略板块\项目\Excel合并\result.csv',sep=',',index=False,encoding="utf_8_sig")
#这里"r'D:\工作\业务策略板块\项目\Excel合并\result.csv'" 也可以用 os.path.join 拼接一下
#添加encoding = "utf_8_sig" 后，打开文件不会乱码。

path = 'D:\工作\业务策略板块\项目\Excel合并\花名册合并'

contant_excel(path)

os.walk是一个非常强大的库，这一点单独拎出来讲讲。

os.walk的语法是

os.walk(top[, topdown=True[, onerror=None[, followlinks=False]]])

top – 是你所要遍历的目录的地址, 返回的是一个三元组(root,dirs,files)。

root 所指的是当前正在遍历的这个文件夹的本身的地址 dirs 是一个 list ，内容是该文件夹中所有的目录的名字(不包括子目录)
files 同样是 list , 内容是该文件夹中所有的文件(不包括子目录) topdown --可选，为 True，则优先遍历 top
目录，否则优先遍历 top 的子目录(默认为开启)。如果 topdown 参数为 True，walk 会遍历top文件夹，与top
文件夹中每一个子目录。

onerror – 可选，需要一个 callable 对象，当 walk 需要异常时，会调用。

followlinks – 可选，如果为 True，则会遍历目录下的快捷方式(linux 下是软连接 symbolic link
)实际所指的目录(默认关闭)，如果为 False，则优先遍历 top 的子目录。

不过更方便的是使用pathlib模块。

於陵樺暉

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
【高效办公】文件夹中的所有excel合并，os和pandas模块

源码概览import osimport pandas as pdframes=[] #新建一个空白列表def contant_excel(path): for root,dirs,files in os.walk(path): #os.walk是一个非常强大的使用 for file in files: df = pd.read_exc...
复制链接

扫一扫