【数据库】HIVE SQL几种排序函数（ROW_NUMBER&RANK&DENSE_RANK）

最新推荐文章于 2024-05-27 11:50:21 发布

J小白Y

最新推荐文章于 2024-05-27 11:50:21 发布

阅读量2.2w

点赞数 5

分类专栏：技术数据库文章标签：排序 hive sql rank row_number

本文链接：https://blog.csdn.net/Jarry_cm/article/details/81904294

版权

技术同时被 2 个专栏收录

56 篇文章 7 订阅

订阅专栏

数据库

35 篇文章 1 订阅

订阅专栏

最初用排序函数时，只会用row_number，后来在网上一看，才知道由于场景不同，是有不同的函数的。

作为一个总结，为以后的使用提供帮助。

一、ROW_NUMBER

二、RANK

三、DENSE_RANK

一、ROW_NUMBER

　　对于排序，使用较为广泛的函数就是row_number。据网上说可以用来实现web程序的分页，小白不懂开发，所以不知道如何来分页。但是，在hive中，它的用途还是很广泛的。row_number和over一起配对使用，每一行记录生成一个序号，依次排序且不会重复。

例如：现有一个场景，一张表中，有这样的记录：

同一个orderid和promotionid，由于修改时间不同有两条纪录，处理结果需要留下修改时间最新的记录。

select *

 from (select orderid,
              promotionid,
              row_number() over(PARTITION BY orderid ORDER BY datachange_lasttime desc) as rank
         from tablename

        )a

where rank=1;

row_number的基本原理是先使用over子句中的排序语句对记录进行排序，然后按照这个顺序生成序号。

Tips：

over子句中的order by子句与SQL语句中的order by子句作用范围不同，如以下sql，over子句中根据SubTime降序排列，Sql语句中则按orderid降序排列。

select orderid,
       promotionid,
       row_number() over(PARTITION BY orderid ORDER BY datachange_lasttime desc) as rank
  from tablename
 order by orderid desc
;

二、RANK

　　RANK函数是对查询结果进行排名，与row_number函数不同的是，rank函数考虑over子句中排序字段值相同的情况，如果使用rank函数来生成序号，over子句中排序字段值相同的序号是一样的，后面字段值不相同的序号将跳过相同的排名号排下一个，也就是相关行之前的排名数加一，可以理解为根据当前的记录数生成序号，后面的记录依此类推。rank函数的使用方法与row_number函数完全相同。

select RANK() OVER(order by [UserId]) as rank,* from [Order]

三、DENSE_RANK

　　dense_rank函数的功能与rank函数类似，dense_rank函数在生成序号时是连续的，而rank函数生成的序号有可能不连续。dense_rank函数出现相同排名时，将不跳过相同排名号，rank值紧接上一次的rank值。在各个分组内，rank()是跳跃排序，有两个第一名时接下来就是第四名，dense_rank()是连续排序，有两个第一名时仍然跟着第二名。将上面的Sql语句改由dense_rank函数来实现。

select DENSE_RANK() OVER(order by [UserId]) as den_rank,* from [Order]

J小白Y

关注

5
点赞
踩
15

收藏

觉得还不错? 一键收藏
1
评论
【数据库】HIVE SQL几种排序函数（ROW_NUMBER&RANK&DENSE_RANK）

最初用排序函数时，只会用row_number，后来在网上一看，才知道由于场景不同，是有不同的函数的。作为一个总结，为以后的使用提供帮助。一、ROW_NUMBER　　对于排序，使用较为广泛的函数就是row_number。据网上说可以用来实现web程序的分页，小白不懂开发，所以不知道如何来分页。但是，在hive中，它的用途还是很广泛的。row_number和over一起配对使用，每一行记录...
复制链接

扫一扫