输出分组_python(pandas)分组与聚合统计

最新推荐文章于 2023-06-21 17:22:26 发布

weixin_39796878

最新推荐文章于 2023-06-21 17:22:26 发布

阅读量1.2k

点赞数 1

文章标签：输出分组

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39796878/article/details/112707845

版权

Pandas分组聚合语法：
df [Condition1] .groupby ([Column1, Column2], as_index=False) .agg({Column3: "mean", Column4:"sum"}) .filter(Condition2)

一、groupby分组

我们可以通过groupby方法来对Series或DataFrame对象实现分组操作。该方法会返回一个分组对象。不过，如果直接查看(输出)该对象，并不能看到任何的分组信息。

groups(属性)：返回一个字典类型对象，包含分组信息。
size：返回每组记录的数量。
discribe：分组查看统计信息。

GroupBy可以分解为三个步骤：split - apply - combine

Splitting: 把数据按主键划分为很多个小组
Applying: 对每个小组独立地使用函数
Combining: 把所得到的结果组合

那么，完成逻辑

Splitting 由 groupby 实现
Applying 由 agg、apply、transform、filter实现具体的操作
Combining 由 concat 等实现

其中，在apply这一步，通常有以下四类操作：

Aggregation:做一些统计性的计算
Apply：做一些数据转换
Transformation:做一些数据处理方面的变换
Filtration:做一些组级别的过滤

二、聚合.agg() df.groupby(...).agg() 分组聚合

count------------分组中非NA值的数量
sum--------------非NA值的和
mean-------------非NA值的平均值
median ----------非NA值的算术中位数
std、var---------无偏(分母为n-1)标准差、方差
min、max---------非NA值的最小值、最大值
prod-------------非NA值的积
first、last------第一个和最后一个非NA值

df.groupby(...).size() 看每一组中有多少个元素 df.groupby(...).gro

最低0.47元/天解锁文章

weixin_39796878

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
输出分组_python(pandas)分组与聚合统计

Pandas分组聚合语法：df [Condition1].groupby([Column1, Column2], as_index=False).agg({Column3: "mean", Column4:"sum"}).filter(Condition2)一、groupby分组我们可以通过groupby方法来对Series或DataFrame对象实现分组操作。该方法会返回一个分组对象。...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。