python Pandas.rank() 排名函数详解

Pandas.rank() 函数详解

一、参数解析

  • method:指定排名时的策略。
    • 默认值为 'average',表示相同值的项将会获得平均排名。
    • 可选的取值还包括
      • 'min':相同值的项将获得最小排名;
      • 'max':相同值的项将获得最大排名;
      • 'first':相同值的项将获得第一次出现时的排名;
      • 'dense'。相同值的项将获得连续排名。
  • ascending:指定排名的顺序。
    • 默认值为 True,升序。
    • 设置为 False 降序。
  • na_option:指定如何处理缺失值(NaN)。
    • 默认值为 'keep',缺失值不参与排名。
    • 设置为 'top' 则将缺失值放在排名结果的顶部。
    • 设置为 'bottom' 则将缺失值放在排名结果的底部。
  • pct:指定是否返回百分比排名。
    • 默认值为 False 表示返回实际的排名值。
    • 设置为 True 则返回相对于总项数的百分比排名值。

二、案例分享

import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Emma', 'Frank'],
        'Score': [90, 85, 85, 75, None, 78]}
df = pd.DataFrame(data)

在这里插入图片描述

默认排名
  • 升序、忽略缺失值;
  • 遇到相同数值(如score=85),排名会平分
df['Rank'] = df['Score'].rank()

在这里插入图片描述

降序: ascending = False
df['Rank'] = df['Score'].rank(ascending=False)

在这里插入图片描述

method = 'min'
  • 相同值的项将获得最小排名;
  • 此处相同值为85,占排名3、4位,取最小3;
  • 此时排名会出现断层
df['Rank'] = df['Score'].rank(method='min')

在这里插入图片描述

method = 'max'
  • 相同值的项将获得最大排名;
  • 此处相同值为85,占排名3、4位,取最大4;
  • 此时排名会出现断层
df['Rank'] = df['Score'].rank(method='max')

在这里插入图片描述

method = 'first'
  • 相同值的项将获得第一次出现时的排名;
  • 此处相同值为85,占排名3、4位,Name=Bob出现在前,Name=Charlie出现在后;
  • 此时排名不会出现断层
df['Rank'] = df['Score'].rank(method='first')

在这里插入图片描述

method = 'dense'
  • 相同值的项将获得连续排名;
  • 此时排名不会出现断层
df['Rank'] = df['Score'].rank(method='dense')

在这里插入图片描述

na_option='bottom'
  • 缺失值参与排名;
  • 缺失值排名靠后
df['Rank'] = df['Score'].rank(na_option='bottom')

在这里插入图片描述

pct = True
  • 返回百分比排名,如此处score=75排名第1(升序),总项数是5,1/5=0.2;
  • 该参数可以扩展的实际需求:求销售额Top20的商品等
df['Rank'] = df['Score'].rank(pct=True)

在这里插入图片描述

  • 8
    点赞
  • 25
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值