前言
分组占比问题一直是工作及面试的高频问题,有经验的小伙伴想必不会陌生;在实际应用场景下多数是使用数据库窗口函数解决,本文将介绍如何使用pandas处理这类问题。需要说明的是,本文主要是思路的分享,所以构造了简单的数据,实际工作中可能面对比较复杂的数据,比如多字段重复,那么要求我们根据实际业务需求先进行数据清洗,但无论多么复杂的场景,思路是一样的。
正文
1、需求及问题
现有一张区域销售数据表,要求按月维度计算各个区域销售额在整个月销售额中的占比,最后按月输出结果到不同的sheet中,数据表样式如下:
2、解决思路
根据要求,按月维度聚合销售额,然后求各区域销售额在总销售额中的占比;然后把结果按月写入excel不同的sheet中,思路很简单,下面直接上代码。
3、实战代码
import
代码写到这,该需求已经基本完成了,让我们看看实际的效果吧:
下面是最后一步,按月输出到不同的sheet:
df
来看看效果:
以上,如果觉得有点用,请记得点赞关注,谢谢!