python groupby组内排序

最新推荐文章于 2024-07-15 20:03:26 发布

gulie8

最新推荐文章于 2024-07-15 20:03:26 发布

阅读量8.9k

点赞数 2

分类专栏：疑难杂症

本文链接：https://blog.csdn.net/gulie8/article/details/89978800

版权

疑难杂症专栏收录该内容

21 篇文章 0 订阅

订阅专栏

#看哪个网站对各大战区贡献CTM业绩最多
qd_cdf_eachnet=qd_cdf[['Root Id','成交类型','成交网站','月份','单数(拆分)',\
                      '业绩(拆分)','成交区董']].drop_duplicates().\
                      groupby(['成交区董','成交网站']).\
                      agg({'单数(拆分)':sum,'业绩(拆分)':sum})
                      

qd_cdf_eachnet['业绩(拆分)'].groupby(level=0, group_keys=False).nlargest(6)

为什么使用df_agg['count'].groupby(level=0)，而不是df_agg.groupby(by=['count'], level=0)？
因为nlargest()函数不能应用于DataFrameGroupBy对象，但可以用于SeriesGroupBy对象。
为什么.groupby()里边需要level=0?
因为"by"和"level"在groupby函数至少得有一个。
不设置group_keys=False会怎样？
会有2个"job"列