数据文件合并

文件批量处理:收到一个文件夹的多份类似文件(如不同月份),怎么将其自动合并起来呢?

首先读取文件夹,读取的文件为dataframe格式,选择append依次添加在第一个文件后

import datetime
path = "D:/file/" # 文件夹,根据实际调整
files= os.listdir(path)
for i in range(len(files)):
    file = files[i]
    print(file)
    starttime = datetime.datetime.now()
    s = pd.read_html(path+file,header= 0) # 文件格式及读取方式,根据实际调整,head=0指将第一行作为标题
    data = s[0]
    data["表格名"]= file # 增加数据所处的表格是哪个文件
    endtime = datetime.datetime.now()
    print (endtime - starttime) # 计算读取所花费的时间
    print(file,"数量",len(data)) #计算各文件的数据长度
    if i == 0:
        result = data
    else:
        result = result.append(data) # 将文件进行合并

result1.to_csv(path+'2019summary.csv',index = False, encoding='utf8') # 输出合并的文件

 

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值