openpyxl合并单元格并写入数据_系统导出合并单元格的Excel做数据分析,你用Python轻松解决...

883f3078178442d3b58e186276b8cbc4.png

转发本文并私信我"python",即可获得Python资料以及更多系列文章(持续更新的)

经常听别人说 Python 在数据领域有多厉害,结果学了很长时间,连数据处理都麻烦得要死。后来才发现,原来不是 Python 数据处理厉害,而是他有数据分析神器—— pandas

前言

做数据分析时,当你拿到一份 Excel 数据之后,我相信你还没有看数据,心就已经凉了一半。这是因为大概率数据格式"好看不好算",今天来看看怎么解决报表格式常见的合并单元格问题。


案例1

今天你接到一个分析需求,需要统计2年内个城市月度平均销量。

你心里期待公司系统导出的数据是这样子:

2bbedc7332bca1f99d0eb8adabd22644.png

实际导出的是这样子:

b2b2d5bed7c60a43dd07e5a30396efd9.png
  • city 列都是合并单元格

你的脸色开始凝重了,因为发现正常导入后的 DataFrame 是这个鬼样子:

68b3212e0ed49ee4a26f1978bb3436ea.png
  • Excel 中的合并单元格,只有第一个格有值,其余的都是空值

其实很容易解决,pandas 中有填充空值的方法:

f5effdf9260324f881ae1bad5e01a33b.png
  • .ffill() ,f 是 forward 的意思。ffill 意思是:"拿前面的值填充后面的空值"

现在你终于放下心头大石,轻松解决城市月度均销量数据:

2836fb3bfc518c309ab64f93270d5182.png
  • 不多说了,专栏都有说的内容

pd.Grouper 可以使用各种频率,具体内容请看专栏第19节内容


9217f6570573e1504005eb067f26333e.png

案例2

有时候你会遇到多列的合并单元格:

38305b6b9feae71311a64e64494e120a.png
  • city 和 sales 列都有合并单元格

pandas 中大部分操作都能在多列间进行:

6e40c9545b33e9252ba6cd12627bbb54.png

78a63281fa288a0442706e75e6989cb2.png

案例3

许多初学者对 pandas 有一种错觉,觉得遇到不同的数据就要重复写代码,其实我们完全可以写出许多便捷的方法。

比如,我们可以遍历一个 DataFrame 的列以及类型,发现是文本则自动调用 ffill 方法,这样不管数据有多少合并单元格列,都可以全自动填充:

289460b99131743fbf5711fbc801c674.png
  • 定义方法 auto_fill_merge_cell ,参数只需要传入数据 DataFrame
  • 关键调用 pd.api.types.is_string_dtype ,判断列是否文本类型

现在只需要简单调用此方法即可,甚至不需要指定哪些列:

b03c0f1b5bab4e86eb8454b6db9bd9ca.png

代码的灵活性在于你能够按照自己的想法,随意组装功能。别再以为教程所有的代码都需要重复编写


总结

  • 遇到 Excel 的合并单元格数据时,可以使用 DataFrame 或 Series 的方法 ffill,向前填充空值

需要源码的小伙伴请转发本文并私信我"python"

如果希望从零开始学习 pandas ,那么可以看看我的 pandas 专栏。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值