python 中求最大值问题_Python:使用groupby获取在组中具有最大值的行

这篇博客介绍了如何利用Pandas库在Python中查找数据框中每个组的最大值,并获取对应的最大值行的索引。通过`groupby()`和`transform()`函数的组合,可以有效地找出每个组内'count'列的最大值,并用布尔索引筛选出这些最大值的行。当一个组中有多个最大值时,所有这些值都会被返回。此外,还展示了如何新增一列'count_max'来标记每个组的最大计数值。
摘要由CSDN通过智能技术生成

In [1]: df

Out[1]:

Sp Mt Value count

0 MM1 S1 a 3

1 MM1 S1 n 2

2 MM1 S3 cb 5

3 MM2 S3 mk 8

4 MM2 S4 bg 10

5 MM2 S4 dgd 1

6 MM4 S2 rd 2

7 MM4 S2 cb 2

8 MM4 S2 uyi 7

In [2]: df.groupby(['Mt'], sort=False)['count'].max()

Out[2]:

Mt

S1 3

S3 8

S4 10

S2 7

Name: count

要获得原始DF的索引,可以这样做:

In [3]: idx = df.groupby(['Mt'])['count'].transform(max) == df['count']

In [4]: df[idx]

Out[4]:

Sp Mt Value count

0 MM1 S1 a 3

3 MM2 S3 mk 8

4 MM2 S4 bg 10

8 MM4 S2 uyi 7

注意,如果每个组有多个最大值,则将返回所有值。

更新

玛丽有机会说这是行动小组的要求:

In [5]: df['count_max'] = df.groupby(['Mt'])['count'].transform(max)

In [6]: df

Out[6]:

Sp Mt Value count count_max

0 MM1 S1 a 3 3

1 MM1 S1 n 2 3

2 MM1 S3 cb 5 8

3 MM2 S3 mk 8 8

4 MM2 S4 bg 10 10

5 MM2 S4 dgd 1 10

6 MM4 S2 rd 2 7

7 MM4 S2 cb 2 7

8 MM4 S2 uyi 7 7

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值