Pandas使用groupby分组后的操作

最新推荐文章于 2024-07-12 17:54:41 发布

论搬砖的艺术

最新推荐文章于 2024-07-12 17:54:41 发布

阅读量1.2k

点赞数 3

分类专栏： Pandas 文章标签： pandas python 数据分析

本文链接：https://blog.csdn.net/qq_53817374/article/details/128222413

版权

15 篇文章 1 订阅

订阅专栏

size()求每个分组的行数量

data_year = data.groupby(['Year']).size().reset_index()

在这里插入图片描述

mean(),min(),max(),sum()统计每个组对应列的平均值，最小值，最大值，和,方差，标准差
例：

data_year = data.groupby(['Year']).min().reset_index()

在这里插入图片描述

传入min,max,sum,‘mean’，‘var’, 'std’类似于上面效果。对不同分组，不同列进行统计操作。

data_year = data.groupby(['Year']).agg(sum).reset_index()

在这里插入图片描述
传入多个值，返回一个多索引的dataframe

data_year = data.groupby(['Year']).agg([min,max]).reset_index()

在这里插入图片描述
传入字典，列名为键，操作为值。对每列进行不同的处理。

data_year = data.groupby(['Year']).agg({'ID': sum, "Age": 'mean', 'Height': 'var', 'Weight': 'std'}).reset_index()

在这里插入图片描述

describe（）方法可用于集体计算每个组的主要统计数据。

data_year = data.groupby(['Year']).describe()

在这里插入图片描述

关注

专栏目录