Python学习笔记—excel文件从第几行读取

本文介绍了如何使用Python的pandas库正确读取Excel文件时,遇到不规则数据的情况,特别是当表头在数据下方时,通过调整`header`参数来指定从哪一行开始作为表头,从而实现正确提取数据。
摘要由CSDN通过智能技术生成

        在读取excel文件时,是否会经常遇到这样不规则的数据,例如下图所示:

        在通过python读取时,会导致读取的表会将专题学习也一块读取,实际我们需要的是将姓名行作为表头:

import pandas as pd

table = pd.read_excel("E:\\python_lean\\table\\专题学习表.xlsx")
print(table)


输出结果:
专题学习 Unnamed: 1     Unnamed: 2 Unnamed: 3 Unnamed: 4
0  NaN        NaN            NaN        NaN        NaN
1  NaN        NaN            NaN        NaN        NaN
2   姓名    学员编号          专题班名称           专题班类型       获得学时
3   小红   20230105       优秀的社畜专修课             必修        4.4
4   小绿   20220411       神奇的牛马选修课             选修        4.4
5   小黑   20201109       如何打碎鸡蛋不让鸡知道        选修        4.4
6   小紫   20240207       成功学会将自己爆炸的秘诀      选修        1.4
7   小黄   20210610       摸鱼是否是必修课的社会研究    必修        2.2

        在上图的情况下,需要将第三行作为表头,只需要在表格读取时,使用header参数设定从第几行开始读取,由此达到将姓名行作为表头的目的:

import pandas as pd

table = pd.read_excel("E:\\python_lean\\table\\专题学习表.xlsx",header=3)
print(table)


输出结果:
  姓名      学员编号       专题班名称       专题班类型  获得学时
0  小红  20230105       优秀的社畜专修课       必修     4.4
1  小绿  20220411       神奇的牛马选修课       选修     4.4
2  小黑  20201109    如何打碎鸡蛋不让鸡知道     选修     4.4
3  小紫  20240207   成功学会将自己爆炸的秘诀    选修     1.4
4  小黄  20210610  摸鱼是否是必修课的社会研究   必修     2.2

  • 11
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值