pandas处理excel单元格合并后的列

Vergil_Zsh

已于 2022-06-23 10:22:02 修改

阅读量7.5k

点赞数 4

分类专栏： pandas操作文章标签： python 数据分析开发语言

于 2022-01-26 10:45:07 首次发布

本文链接：https://blog.csdn.net/KIKI_ZSH/article/details/122696721

版权

pandas操作专栏收录该内容

13 篇文章

订阅专栏

本文介绍如何使用Python的pandas库处理Excel中合并的单元格问题，并通过代码示例展示了如何提取时间列并调整列名。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

日常处理数据时会面临到一种excel数据就是单元格合并,但是在pandas读取的时候会被分位两行读取(意:显示位2行一行为空值或者更多)

这里主要讲下单元格合并两行的时候,其他的与之类似

这里有我已经创建好的excel表格
在这里插入图片描述
pandas读取进去后显示为

在这里插入图片描述
这里我做一个要求希望我们最后的列名为[ID,姓名,性别,年龄,再加上第二行的日期]

# 导入判断时间列的库
import datetime
import pandas as pd
data = pd.read_excel(r'./data/test3.xlsx')
print('输出原始数据: ', data,'\n')
# 取第一行type为datetime的name
time_col = [col for col in data.iloc[0,:].tolist() if type(col) == datetime.datetime]
print('time_col: ', time_col, '\n')
need_cols = data.columns.tolist()[0:4]
print('需要的列名: ', need_cols,'\n')
# 使用列表拼接,得到最终的列
data_all = need_cols + time_col

# 直接进行列名修改
data.columns = data_all
print('修改列名之后: ', data, '\n')

# 这里需要删除第一行
data = data.drop(0)
print('处理完后的数据: ', data, '\n')

运行结果如下图
在这里插入图片描述

这里需要声明的一点,可能有些人觉得没有必要这么麻烦可以直接使用内置函数reindex(columns=col_list)这种方法

这个函数的前提是较为麻烦的需要将数据也要按照列取下来如果碰见很复杂的数据需要根据列名的索引进行获取的可以不然会出现下列情况
在这里插入图片描述
reindex函数相当于对列重新组合,所以要求你的新列前提是要有数据的后面我将更新我在工作中所碰到的问题,当时我是用reindex解决的
如果大家还有更为简单的方法可以给我留言欢迎讨论