python pandas中的agg函数

python中的agg函数通常用于调用groupby()函数之后,对数据做一些聚合操作,包括sum,min,max以及其他一些聚合函数
如下所示:

>>> df = pd.read_excel(r"D:/myExcel/1.xlsx")
>>> df
        A   B   C
0     bob  12  45
1  millor  15  23
2     bob  34  88
3     bob  98  231)获取按A分组后B列的最大值
>>> df.groupby(by='A').agg({'B':'max'})
         B
A         
bob     98
millor  152)获取按A分组后B列的最大值和最小值
>>> df.groupby(by='A').agg({'B':['max','min']})
         B    
       max min
A             
bob     98  12
millor  15  153)获取按A分组后B列的最大值和最小值以及C列的最大值
>>> df.groupby(by='A').agg({'B':['max','min'], 'C':'min'})
         B       C
       max min min
A                 
bob     98  12  23
millor  15  15  234)默认是以函数名称命名的,可以修改
>>> df.groupby(by='A').agg(
b_min=pd.NamedAgg(column='B', aggfunc='min'),
b_max=pd.NamedAgg(column='B', aggfunc='max'))
        b_min  b_max
A                   
bob        12     98
millor     15     15

通常在调用完agg函数后需要reset_index,因为pandas会默认将groupby()的列也做为index传到结果中

>>> df.groupby('A').B.agg(['min', 'max'])
        min  max
A               
bob      12   98
millor   15   15
>>> df.groupby('A').B.agg(['min', 'max']).reset_index()
        A  min  max
0     bob   12   98
1  millor   15   15

哈哈,以上就是python小工具关于agg函数的介绍,挺有用 的一个函数。
欢迎关注公众号:python小工具,获取更多关于pandas的学习的知识。
让我们一起为实现办公自动化努力吧。
在这里插入图片描述

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值