pandas用均值填充nan_excel数据处理需求,透视表无法解决?用Python吧

本文通过案例展示了如何使用Python的pandas库处理包含合并单元格和不规范格式的表格数据,包括用均值填充缺失值(NaN)、数据重塑等操作,以达到数据整理的目标。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

a5f8180d45fb3dcc06ba55c6fa4340df.png

请关注本号,后续会有更多相关教程。转发本文并私信我"python",即可获得按水平领域分类好的Python资料

系列文章

  1. "替代Excel Vba"系列(一):用Python的pandas快速汇总
  2. "Python替代Excel Vba"系列(二):pandas分组统计与操作Excel

前言

本系列前2篇已经稍微展示了 python 在数据处理方面的强大能力,这主要得益于 pandas 包的各种灵活处理方式。

但是身经百战的你肯定会觉得,前2篇例子中的数据太规范了,如果把数据导入到数据库还是可以方便解决问题的。

因此,本文将使用稍微复杂的数据做演示,充分说明 pandas 是如何灵活处理各种数据。

本文要点:

  • 使用 pandas 处理不规范数据。
  • pandas 中的索引。

注意:虽然本文是"Python替代Excel Vba"系列,但希望各位读者明白,工具都是各有所长,选择适合的工具,才是最好的。

aab6e0bb68b34510c4e341bd78151b3b.png

案例

这次的数据是一个教师课程表。如下图:

00fa7f8a228429f109b0ab8c626369e7.png
  • 其中表格中的第3行是班级。诸如"一1",表示是一年级1班,最多8个年级。
  • 表格中的1至3列,分别表示"星期"、"上下午"、"第几节课"。
  • 前2列有大量的合并单元格,并且数据量不一致。比如星期一有9行,但星期二却只有7行。
  • 表格的主要内容是,每天每个班级的每堂课是什么课以及是哪位教师负责。诸如"语文xxx",表示这是语文课,由xxx老师负责。这里的名字按照原有数据做了脱敏。</
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值