hive系列-2.hive自带的三种排序UDF

最新推荐文章于 2023-04-01 18:01:03 发布

JackieChen1992

最新推荐文章于 2023-04-01 18:01:03 发布

阅读量822

点赞数

分类专栏： hive 文章标签： hive rank udf dense_rank row_number

本文链接：https://blog.csdn.net/cshichunhua/article/details/90899505

版权

Hive自带的几种rank函数

综述

1.ROW_NUMBER() => 用于纯数据排序，相同值排序也不同
//全局唯一排序
2.DENSE_RANK() =>常搭配PARTITION BY x ORDER BY y用于分组取（唯一）数据
//连续排序
3.RANK() =>常用于类似成绩排名之列的场景
//跳跃排序，重复几次排序跳几个

具体样例

初始化

create table tmp.test_rank(id string,salary float);
insert into table tmp.test_rank select "1",24000;
insert into table tmp.test_rank select "1",24000;
insert into table tmp.test_rank select "1",25000;

ROW_NUMBER()

select *,row_number() over (order by salary) from tmp.test_rank;
+-----+----------+---------+
| id  |  salary  | _wcol0  |
+-----+----------+---------+
| 1   | 24000.0  | 1       |
| 2   | 24000.0  | 2       |
| 1   | 24000.0  | 3       |
| 1   | 25000.0  | 4       |
+-----

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

JackieChen1992

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
hive系列-2.hive自带的三种排序UDF

Hive自带的几种rank函数综述1.ROW_NUMBER() => 用于纯数据排序，相同值取//全局唯一排序2.DENSE_RANK() =>常搭配PARTITION BY x ORDER BY y用于分组取（唯一）数据//连续排序3.RANK() =>//跳跃排序，重复几次排序跳几个具体样例初始化create table tmp.test_rank(id ...
复制链接

扫一扫