
请关注本号,后续会有更多相关教程。转发本文并私信我"python",即可获得按水平领域分类好的Python资料
系列文章
- "替代Excel Vba"系列(一):用Python的pandas快速汇总
- "Python替代Excel Vba"系列(二):pandas分组统计与操作Excel
前言
本系列前2篇已经稍微展示了 python 在数据处理方面的强大能力,这主要得益于 pandas 包的各种灵活处理方式。
但是身经百战的你肯定会觉得,前2篇例子中的数据太规范了,如果把数据导入到数据库还是可以方便解决问题的。
因此,本文将使用稍微复杂的数据做演示,充分说明 pandas 是如何灵活处理各种数据。
本文要点:
- 使用 pandas 处理不规范数据。
- pandas 中的索引。
注意:虽然本文是"Python替代Excel Vba"系列,但希望各位读者明白,工具都是各有所长,选择适合的工具,才是最好的。

案例
这次的数据是一个教师课程表。如下图:

- 其中表格中的第3行是班级。诸如"一1",表示是一年级1班,最多8个年级。
- 表格中的1至3列,分别表示"星期"、"上下午"、"第几节课"。
- 前2列有大量的合并单元格,并且数据量不一致。比如星期一有9行,但星期二却只有7行。
- 表格的主要内容是,每天每个班级的每堂课是什么课以及是哪位教师负责。诸如"语文xxx",表示这是语文课,由xxx老师负责。这里的名字按照原有数据做了脱敏。</