如何理解《利用Python进行数据分析》一书中的rank()排名方法

本文详细解读《利用Python进行数据分析》中pandas的rank()方法,包括平均排名、观察顺序排名和降序排名。通过实例分析,解释了rank()在遇到相同数值时的处理方式,以及如何对DataFrame的行或列进行排名。
摘要由CSDN通过智能技术生成

还是因为在项目中需要对数据集进行排名,所以就去查找资料和翻书里关于pandas是如何对数据进行排名的方法,然后就学到了rank()。因为发现书里讲的很简洁,尤其是例子的解释很少,所以打算写下自己对书中案例的理解,希望能帮到有需要的人。如果有理解错误的地方,欢迎指出来我们一起探讨一下!?

  • 首先我们来看书中第一个例子:
obj = pd.Series([7,-5,7,4,2,0,4])
obj.rank()

然后输出结果为:

0  6.5
1  1.0
2  6.5
3  4.5
4  3.0
5  2.0
6  4.5 

问题一: 为何这里的排名会是“6.5、1.0…”这样的写法?
解答:

  1. 首先我们先看原始数据,我们把它竖起来看:
7
-5
7
4
2
0
4
  1. 接着我们对它按从小到大排名次:
       rank
0      -5
1       0
2       
  • 4
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值