Python学习笔记—excel文件从第几行读取

need help

已于 2024-02-28 17:55:19 修改

阅读量515

点赞数 11

文章标签：学习笔记

于 2024-02-27 18:11:39 首次发布

本文链接：https://blog.csdn.net/hleps/article/details/136325465

版权

本文介绍了如何使用Python的pandas库正确读取Excel文件时，遇到不规则数据的情况，特别是当表头在数据下方时，通过调整`header`参数来指定从哪一行开始作为表头，从而实现正确提取数据。

摘要由CSDN通过智能技术生成

在读取excel文件时，是否会经常遇到这样不规则的数据，例如下图所示：

在通过python读取时，会导致读取的表会将专题学习也一块读取，实际我们需要的是将姓名行作为表头：

import pandas as pd

table = pd.read_excel("E:\\python_lean\\table\\专题学习表.xlsx")
print(table)


输出结果：
专题学习 Unnamed: 1     Unnamed: 2 Unnamed: 3 Unnamed: 4
0  NaN        NaN            NaN        NaN        NaN
1  NaN        NaN            NaN        NaN        NaN
2   姓名    学员编号          专题班名称           专题班类型       获得学时
3   小红   20230105       优秀的社畜专修课             必修        4.4
4   小绿   20220411       神奇的牛马选修课             选修        4.4
5   小黑   20201109       如何打碎鸡蛋不让鸡知道        选修        4.4
6   小紫   20240207       成功学会将自己爆炸的秘诀      选修        1.4
7   小黄   20210610       摸鱼是否是必修课的社会研究    必修        2.2

在上图的情况下，需要将第三行作为表头，只需要在表格读取时，使用header参数设定从第几行开始读取，由此达到将姓名行作为表头的目的：

import pandas as pd

table = pd.read_excel("E:\\python_lean\\table\\专题学习表.xlsx",header=3)
print(table)


输出结果：
  姓名      学员编号       专题班名称       专题班类型  获得学时
0  小红  20230105       优秀的社畜专修课       必修     4.4
1  小绿  20220411       神奇的牛马选修课       选修     4.4
2  小黑  20201109    如何打碎鸡蛋不让鸡知道     选修     4.4
3  小紫  20240207   成功学会将自己爆炸的秘诀    选修     1.4
4  小黄  20210610  摸鱼是否是必修课的社会研究   必修     2.2