Python-pandas读取无表头的csv/xlsx文件&加上指定表头(相当于无表头也保留了第一行数据)

本文介绍了如何使用pandas在处理无表头的Excel文件时,保留第一行数据作为自定义表头。作者面临50张80万行的Excel数据,需要高效读取并添加表头,通过分享解决方案,避免了多次加载导致的时间消耗,旨在帮助读者解决类似问题。
摘要由CSDN通过智能技术生成
  • 🌸 欢迎来到Python办公自动化专栏—Python处理办公问题,解放您的双手

  • 🏳️‍🌈 博客主页:一晌小贪欢的博客主页

  • 👍 该系列文章专栏:Python办公自动化专栏

  • 文章作者技术和水平有限,如果文中出现错误,希望大家能指正🙏

  • ❤️ 欢迎各位佬关注! ❤️

今天一上午都在找相关-python库-pandas读取excel保留第一行的文章,其实这个我也会,就是如下,下面代码就是获取一张excel表格的,第一行(表头)

 df = pandas.read_excel("./test.xlsx",dtype=str,keep_default_na='').head(0)
print(list(df))

但是我今天的工作是,有50张excel表格,每张都有80W行的数据量,每一个都没有表头,如果用正常的pandas读取excel,或默认跳过第一行,那么就会丢失50行数据,如果用上面的代码,那么新的问题又来了,就是数据加载一边读第一行,再加载一边读剩下的数据,pandas读取一张80万行的excel表需要120秒,加载两次就需要240秒,50张表就是3.3h,所以直接否定!

终于找到这篇文章:原文章点我,既然没找到可以保留第一行+所有的数据源的文章,那么,我可以参考这篇文章:加上头,不就好了,所以非常感谢这篇文章!

在这里插入图片描述
在这里插入图片描述

奉上完整代码

import pandas

df = pandas.read_excel("./test.xlsx",dtype=str,keep_default_na='',header=None)
for d in df.values.tolist():
    print(d)

再次感谢博主

希望对大家有帮助,如有错误,欢迎指正

致力于办公自动化的小小程序员一枚

致力于写出清楚的博客

都看到这了,关注+点赞+收藏=不迷路!!

  • 4
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值