Python - Pandas 数据分组groupby

最新推荐文章于 2024-01-04 14:18:02 发布

DreamingBetter

最新推荐文章于 2024-01-04 14:18:02 发布

阅读量5.4k

点赞数 2

分类专栏： Pandas 文章标签： python

本文链接：https://blog.csdn.net/DreamingBetter/article/details/123816046

版权

11 篇文章 1 订阅

订阅专栏

在这里插入图片描述

df为
在这里插入图片描述

df.groupby('A').sum()

返回结果，可见A变成索引列，里面的值进行了分类有bar、foo。因为调用sum函数，B列不是数字，自动忽略。
在这里插入图片描述
2. 多列groupby，查询所有数据列的平均数

df.groupby(['A', 'B']).mean()

A、B变成了二级索引
在这里插入图片描述
如果不希望A、B变成索引，可以修改as_index参数为False

df.groupby(['A', 'B'], as_index=False).mean()

在这里插入图片描述

df.groupby('A').agg([np.sum, np.mean, np.std])

列变成了多级索引
在这里插入图片描述
4. 查看单列的数据统计结果

# 查看分组后 某列多种数据统计结果
df.groupby('A')['C'].agg([np.sum, np.mean, np.std])

# 查看分组后 某列一种数据统计结果
df.groupby('A')['C'].max()

df.groupby('A').agg({'C': np.sum, 'D': np.mean})

在这里插入图片描述

按某一列分组的情况：

g = df.groupby('A')

返回结果是个DataFrameGroupBy对象，可直接遍历在这里插入图片描述

for name, group in g:
	print(name)
	print(group)
	print()

在这里插入图片描述
通过get_group方法获取某个分组的数据

g.get_group('bar')

在这里插入图片描述
按多列分组的情况：

g = df.groupby(['A', 'B'])

这里的返回结果name就是一个包含两个元素的元组
所以可以这么获取分组的数据

g.get_group(('foo', 'one'))

*此文仅为个人笔记

DreamingBetter

关注