pandas 读取所有表头_使用Pandas读取复杂的Excel数据

本文介绍了如何使用pandas的header和usecols参数读取非标准格式的Excel数据,以及结合openpyxl库处理更复杂的数据结构。通过示例展示了如何选择特定列、处理缺失数据,并通过openpyxl直接操作Excel文件,实现对复杂表格数据的灵活读取。
摘要由CSDN通过智能技术生成

15f6201f1bd7d920c9519653e0017e21.png

关于Excel数据处理,很多同学可能使用过Pyhton的pandas模块,用它可以轻松地读取和转换Excel数据。但是实际中Excel表格结构可能比较杂乱,数据会分散不同的工作表中,而且在表格中分布很乱,这种情况下啊直接使用pandas就会非常吃力。本文虫虫给大家介绍使用pandas和openpyxl读取这样的数据的方法。

问题缘起

pandas read_excel函数在读取Excel工作表方面做得很好。但是,如果数据不是从头开始,不是从单元格A1开始的连续表格,则结果会不是很好。比如下面一个销售表,使用read_excel读取:

c9381d6d9d95d156c8d34422151887e6.png

读取的结果如下所示:

c6eb4e57d00ab6508c53fcac27983eec.png

结果标题表头会变成Unnamed,而且还会额外增加很多NaN列,

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值