Pandas学习笔记——分组

本文详细介绍了Pandas中的分组操作,包括分组模式、聚合函数、变换和过滤、跨列分组。通过示例展示了如何按照不同依据进行分组,如何使用内置聚合函数、agg方法以及自定义函数进行数据处理,还探讨了transform方法和过滤操作在分组中的应用,最后解释了apply函数在跨列分组中的作用。
摘要由CSDN通过智能技术生成

一、分组模式及其对象

1.分组的一般模式
分组操作在日常生活中使用极其广泛,但要想实现分组操作,必须明确三个要素:分组依据、数据来源、操作及其返回结果。
分组代码的一般模式为:

df.groupby(分组依据)[数据来源].使用操作

例如按照性别统计身高的中位数:

df = pd.read_csv('C:/Users/lz/Desktop/joyful-pandas-master/data/learn_pandas.csv')
fz = df.groupby('Gender')['Height'].median()
print(fz)

结果为:

Gender
Female    159.6
Male      173.4
Name: Height, dtype: float64

2.分组依据的本质
在进行多个维度分组时,需要在groupby中传入相应列名构成的列表即可。
例如,根据学校和性别进行分组可以如下表示:

df = pd.read_csv('C:/Users/lz/Desktop/joyful-pandas-master/data/learn_pandas.csv')
fzbz = df.groupby(['School','Gender'])['Height'].mean()
print(fzbz)

结果为:

School                         Gender
Fudan University               Female    158.776923
                               Male      174.212500
Peking University              Female    158.666667
                               Male      172.030000
Shanghai Jiao Tong University  Female    159.122500
                               Male      176.760000
Tsinghua University            Female    159.753333
                               Mal
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值