【高效办公】文件夹中的所有excel合并,os和pandas模块

源码概览

import os
import pandas as pd

frames=[]		#新建一个空白列表

def contant_excel(path):
    for root,dirs,files in os.walk(path):		#os.walk是一个非常强大的方法
        for file in files:
            df = pd.read_excel(os.path.join(root,file))		#用os.path.join将两个路径拼接
            frames.append(df)		#将转化的df存入到frames列表中,不然后面的df会覆盖前面的df
    result = pd.concat(frames)		#pd.concat将frames列表中的df拼接成一个数据集,存入result
    result.to_csv(r'D:\工作\业务策略板块\项目\Excel合并\result.csv',sep=',',index=False,encoding="utf_8_sig")
#这里"r'D:\工作\业务策略板块\项目\Excel合并\result.csv'" 也可以用 os.path.join 拼接一下
#添加encoding = "utf_8_sig" 后,打开文件不会乱码。

path = 'D:\工作\业务策略板块\项目\Excel合并\花名册合并'

contant_excel(path)

os.walk是一个非常强大的库,这一点单独拎出来讲讲。

os.walk的语法是

os.walk(top[, topdown=True[, onerror=None[, followlinks=False]]])

top – 是你所要遍历的目录的地址, 返回的是一个三元组(root,dirs,files)。

root 所指的是当前正在遍历的这个文件夹的本身的地址 dirs 是一个 list ,内容是该文件夹中所有的目录的名字(不包括子目录)
files 同样是 list , 内容是该文件夹中所有的文件(不包括子目录) topdown --可选,为 True,则优先遍历 top
目录,否则优先遍历 top 的子目录(默认为开启)。如果 topdown 参数为 True,walk 会遍历top文件夹,与top
文件夹中每一个子目录。

onerror – 可选,需要一个 callable 对象,当 walk 需要异常时,会调用。

followlinks – 可选,如果为 True,则会遍历目录下的快捷方式(linux 下是软连接 symbolic link
)实际所指的目录(默认关闭),如果为 False,则优先遍历 top 的子目录。

不过更方便的是使用pathlib模块。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值