rank()、dense_rank()和row_number()的区别

最新推荐文章于 2024-08-01 08:57:38 发布

积跬步至万里

最新推荐文章于 2024-08-01 08:57:38 发布

阅读量1.8k

点赞数 4

分类专栏： Hive 文章标签：数据仓库 mysql sql hive

本文链接：https://blog.csdn.net/qq_43279647/article/details/114262415

版权

Hive 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

函数说明

rank() 排序相同时会重复，总数不会变
dense_rank() 排序相同时会重复，总数会减少
row_number() 会根据顺序计算

这三个函数很经常使用，也很经常被混淆，在面试中也是常常被提及，下面提供一个案例来帮助理解，以及最后用一点小思维帮助大家记忆区分。
在这里插入图片描述

案例：
1）数据准备
在这里插入图片描述
2）需求
计算每门学科成绩排名。

3）创建本地score.txt，导入数据

[ysh@hadoop102 datas]$ vi score.txt

4）创建hive表并导入数据

create table score(
	name string,
	subject string,
	score int)
row format delimited fields terminated by "\t";
load data local inpath '/opt/module/datas/score.txt' into table score;

5）按需求查询数据

select name,
	subject,
	score,
	rank() over(partition by subject order by score desc) rp,
	dense_rank() over(partition by subject order by score desc) drp,
	row_number() over(partition by subject order by score desc) rmp
from score;