还是因为在项目中需要对数据集进行排名,所以就去查找资料和翻书里关于pandas是如何对数据进行排名的方法,然后就学到了rank()。因为发现书里讲的很简洁,尤其是例子的解释很少,所以打算写下自己对书中案例的理解,希望能帮到有需要的人。如果有理解错误的地方,欢迎指出来我们一起探讨一下!?
- 首先我们来看书中第一个例子:
obj = pd.Series([7,-5,7,4,2,0,4])
obj.rank()
然后输出结果为:
0 6.5
1 1.0
2 6.5
3 4.5
4 3.0
5 2.0
6 4.5
问题一: 为何这里的排名会是“6.5、1.0…”这样的写法?
解答:
- 首先我们先看原始数据,我们把它竖起来看:
7
-5
7
4
2
0
4
- 接着我们对它按从小到大排名次:
rank
0 -5
1 0
2

本文详细解读《利用Python进行数据分析》中pandas的rank()方法,包括平均排名、观察顺序排名和降序排名。通过实例分析,解释了rank()在遇到相同数值时的处理方式,以及如何对DataFrame的行或列进行排名。
最低0.47元/天 解锁文章
617

被折叠的 条评论
为什么被折叠?



