apply筛选 pandas_Pandas 分组聚合统计

最新推荐文章于 2023-05-09 15:45:47 发布

weixin_39712865

最新推荐文章于 2023-05-09 15:45:47 发布

阅读量456

点赞数

文章标签： apply筛选 pandas

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39712865/article/details/111797609

版权

本文介绍了Pandas中分组数据的统计方法，如`groupby`后使用`describe()`、`sum()`等进行分组统计，并详细讲解了`agg()`、`transform()`函数的用法，以及如何进行分组筛选和过滤操作。通过实例展示了如何进行聚合、转换和筛选数据，如计算分组最大值、最小值、平均值、标准差，以及如何按组筛选成绩大于平均值的记录。

摘要由CSDN通过智能技术生成

说明

Pandas 中文教程修订中，欢迎加微信 sinbam 提供建议、纠错、催更。查看更新日志

对数据进行分组后，我们就可以收获果实了，我们给分组给定统计方法，最终得到分组聚合的结果。除了常见的数学统计方法，还可以使用 agg() 和 transform() 等函数进行操作。

分组统计方法

分组对象支持几乎所有的 df 的统计方法，见数学统计方法，这些方法会按组统计，最终输出 df 或者序列：

df.groupby('team').describe()

df.groupby('team').sum()

df.groupby('team').count() # 每组数量，不包括缺失值

df.groupby('team').max()

df.groupby('team').min()

df.groupby('team').size()

df.groupby('team').mean()

df.groupby('team').median()

df.groupby('team').std()

df.groupby('team').var()

grouped.corr()

grouped.sem()

grouped.prod()

grouped.cummax() # 每组的累计最大值

grouped.cumsum() # 累加

grouped.mad() # 平均绝对偏差

特别的有：

df.groupby('team').first() # 组内第一个

df.groupby('team').last() # 组内最后一个

df.groupby('team').ngroups # 5 分组数

df.groupby('team').ngroup() # 分组序号

# 库姆计数，按组对成员标记, 支持正排倒排

# 返回每个元素在所在组的序号的序列

grouped.cumcount(ascending=False)

给定分位，返回每组的分位值：

df = pd.DataFrame([

['a', 1], ['a', 2], ['a', 3],

['b', 1], ['b', 3], ['b', 5]

], columns=['key', 'val'])

df.groupby('key').quantil

最低0.47元/天解锁文章

weixin_39712865

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
apply筛选 pandas_Pandas 分组聚合统计

说明Pandas 中文教程修订中，欢迎加微信 sinbam 提供建议、纠错、催更。查看更新日志对数据进行分组后，我们就可以收获果实了，我们给分组给定统计方法，最终得到分组聚合的结果。除了常见的数学统计方法，还可以使用 agg() 和 transform() 等函数进行操作。分组统计方法分组对象支持几乎所有的 df 的统计方法，见数学统计方法，这些方法会按组统计，最终输出 df 或者序列：df.gr...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。