pandas dataframe 分组聚合

本文分享了使用Pandas进行数据分组聚合时遇到的问题及解决方案。通常,分组后的组名会变为DataFrame的index,这在处理长uid时不太方便。文章详细介绍了如何在分组时设置as_index参数为False,从而避免这一问题,使得利用uid进行数据选择和表连接成为可能。
摘要由CSDN通过智能技术生成

利用pandas做分组聚合时,分组组名默认是变化成index,如图

grouped = tdf.groupby('uid')
mean=grouped.mean();
forwardmeandf=pd.DataFrame(mean)

代码中tdf是一个dataframe 当以uid分组,并求每组的平均值后在转化为dataframe ,组名并入到index

在这里插入图片描述

这样非常不方便我们通过index获取值,因为uid太长了。这个问题苦恼了我很久,终于在官方文档中看到解决方法,只要在分组的时候指定as_index=false便可。

grouped = tdf.groupby('uid',as_index=False)
mean=grouped.mean();
forwardmeandf=pd.DataFrame(mean)

结果如图

在这里插入图片描述
这样不但方便我们利用index做选取,而且使利用uid与没有分组的表做join也成为可能。

链接:https://blog.csdn.net/u011199646/article/details/48109839/

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值