需求：用pandas 依据某列的值进行从小到大排名，排名从0开始，如果某列值相同则排名相同，总排名数小于记录条数

最新推荐文章于 2024-07-04 10:40:53 发布

zjc4j

最新推荐文章于 2024-07-04 10:40:53 发布

阅读量580

点赞数

分类专栏：大数据文章标签：数据分析 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_29494693/article/details/118154712

版权

大数据专栏收录该内容

11 篇文章 0 订阅

订阅专栏

需求

需求：用pandas 依据某列的值进行从小到大排名，排名从0开始，如果某列值相同则排名相同，总排名数小于记录条数。

实现

之前，用下面的方法来实现上面的需求，但是因为数据量太大了，我从晚上开始运行，到第二天来还没运行出来结果，后来直接OOM了…
在这里插入图片描述
后来，突然想到hive中rank()函数、DENSE_RANK()、ROW_NUMBER()函数了，这三个函数功能分别是：
RANK() 排序相同时会重复，总数不会变（两个满分，99分的是第三名）
DENSE_RANK() 排序相同时会重复，总数会减少（两个满分，99分的是第二名）
ROW_NUMBER() 会根据顺序计算（两个一百分会按照某种方式排第一第二）。
通过查询，pandas果然有相应的方法rank(),要使用method='dense’才能满足我上面的需求。
在这里插入图片描述

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。