【Pandas分组聚合】进阶:使用自定义函数方法 transform() 、apply()

Pandas使用自定义方法分组聚合

创建一个dataframe结构

import pandas as pd

df = pd.DataFrame(
    data={
        'name': ['z_s', 'l_s', 'w_w', 'z_l', 'y_s', 'j_j', 'l_b', 'z_f', 'hs_q', 'lbl_k', 'qy_n', 'mg_n'],
        'score': [100, 97, 98, 89, 67, 59, 29, 87, 78, 89, 88, 80],
        'group': [1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2],
        'cls': ['A', 'A', 'A', 'B', 'B', 'B', 'A', 'A', 'A', 'B', 'B', 'B'],
        'height': [178.0, 180.0, 176.0, 182.0, 189.0, 190.0, 172.5, 175.0, 165.0, 160.0, 158.5, 159.0]
    },
    index=['stu_' + str(i) for i in np.arange(1, 13, 1)]
)
print('df:\n', df)

def func_add_one(x):
    return x + 1

transform方法

# 调用自定义函数
ret = df.loc[:, 'score'].transform(func_add_one)
print('ret1:\n',ret)
# 调用numpy指标 求均值
ret = df.groupby(by=['cls'])['score'].transform(np.mean)
print('ret2:\n', ret)
# 求 多列的均值
ret = df.groupby(by=['cls'])[['score','height']].transform(np.mean)
print('ret3:\n', ret)

在这里插入图片描述

由结果可以发现,transform调用统计指标会将统计结果交给第一项,这样可以保证统计结果的行数与原数组相同,使得之后方便将其拼接到原数组中。

如果想将结果进行聚合,可以调用apply方法:

apply方法

# 调用自定义函数
ret = df.loc[:, 'score'].apply(func_add_one)
print('ret1:\n',ret)

# 调用numpy指标
ret = df.groupby(by=['cls'])[['score','height']].apply(np.mean)
print('ret2:\n', ret)

在这里插入图片描述

补充

transporm 方法是将DataFrameSeries中的值同时放入指定的函数中执行,再将结果返回。

获取 name的第0个元素

def func_get_firstnameword(x):
    return x[0]

ret = df['name'].transform(func_get_firstnameword)
print('ret:\n', ret)

在这里插入图片描述

自定义方法拥有很大的可操作性,通过自定义方法可以对数据进行一系列操作,最终得到想要的结果。


str

除此之外,还可以使用str方法,这是一种类似于 dt 的方法(dt的使用

ret = df['name'].str.split('_', expand=True)[0]
print('ret:\n', ret)

在这里插入图片描述

str 的作用是将整个 Series当作str对象,对Series中的所有元素同时执行.split('_', expand=True)[0]方法,其中expand=True的作用是指定split()方法是对整个Series进行操作的,而不是只对第一个元素进行操作:

ret = df['name'].str.split('_')[0]
print('ret:\n', ret)

在这里插入图片描述

  • 1
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

胡桃の壶

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值