Pandas学习 - 分组

最新推荐文章于 2023-07-02 12:24:08 发布

-Helslie

最新推荐文章于 2023-07-02 12:24:08 发布

阅读量559

点赞数

分类专栏： python学习

本文链接：https://blog.csdn.net/Helslie/article/details/105724783

版权

本文介绍了Pandas库中的groupby函数，详细讲解了如何根据一列或多列进行分组，以及查看分组后的信息。接着，文章讨论了聚合、过滤和变换操作，包括常用的聚合函数、自定义函数以及过滤和变换的方法。此外，还阐述了apply函数的灵活性及其在统计多个指标中的应用。最后，提出了几个关于fillna、groupby操作、分位数计算、filter函数意义以及聚合、变换、过滤异同的问题供读者思考和练习。

摘要由CSDN通过智能技术生成

一、groupby函数

1. 分组函数的基本内容：

（a）根据某一列分组

grouped_single = df.groupby('School')

注意，这里的设置是没有显式的返回对象的，那么需要特殊的方法来调取结果。

# 找到分组变量值为S_1的记录
grouped_single.get_group('S_1').head()

（b）根据某几列分组

grouped_mul = df.groupby(['School','Class'])
# 即传入两个组值的索引，注意是圆括号
grouped_mul.get_group(('S_2','C_4'))

（c）组容量与组数

这里是给出方法来查看分组之后的一些元素：

# 单列分组容量
grouped_single.size()

在这里插入图片描述

# 多列分组容量
grouped_mul.size()

在这里插入图片描述

# 单列分组组数，注意没有()
grouped_single.ngroups
# 多列分组组数
grouped_mul.ngroups

（d）组的遍历

for name, group in grouped_single:
    print(name)
    display(group.head())

在这里插入图片描述
（e）level参数（用于多级索引）和axis参数

df.set_index(['Gender','School']).groupby(level=1,axis=0).get_group('S_1').head()

在这里插入图片描述

df.set_index(['Gender','School']).groupby(level=0,axis=0).get_group('M').head()

在这里插入图片描述
2. groupby对象的特点

（a）分组对象的head和first

# 返回每个组的前几行
grouped_single.head(2)
# 返回每个组的第一行
grouped_single.first()

（b）分组依据

df.groupby(np.random.choice(['a','b','c'],df.shape[0])

最低0.47元/天解锁文章

-Helslie

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
Pandas学习 - 分组

一、groupby函数1. 分组函数的基本内容：（a）根据某一列分组grouped_single = df.groupby('School')注意，这里的设置是没有显式的返回对象的，那么需要特殊的方法来调取结果。# 找到分组变量值为S_1的记录grouped_single.get_group('S_1').head()（b）根据某几列分组grouped_mul = df.gro...
复制链接

扫一扫

专栏目录