窗口函数 RANK()
和 DENSE_RANK()
都是用于计算某个分组中每一行的排名,区别在于它们对于并列排名的处理不同。具体来说:
RANK()
:如果有多行数据排名相同,它们的排名将会相同,下一个排名将会跳过这些排名相同的行。DENSE_RANK()
:如果有多行数据排名相同,它们的排名也将相同,但是下一个排名将会继续紧随这些排名相同的行。
举个例子,假设有以下表格
+----+-------+
| id | score |
+----+-------+
| 1 | 95 |
| 2 | 80 |
| 3 | 90 |
| 4 | 95 |
| 5 | 85 |
+----+-------+
我们可以使用以下 SQL 查询语句来计算各个分数的排名:
SELECT id, score,
RANK() OVER (ORDER BY score DESC) AS rank,
DENSE_RANK() OVER (ORDER BY score DESC) AS dense_rank
FROM scores;
执行该查询语句后,将得到以下结果:
+----+-------+------+------------+
| id | score | rank | dense_rank |
+----+-------+------+------------+
| 1 | 95 | 1 | 1 |
| 4 | 95 | 1 | 1 |
| 3 | 90 | 3 | 2 |
| 5 | 85 | 4 | 3 |
| 2 | 80 | 5 | 4 |
+----+-------+------+------------+
可以看到,根据分数排序后,id 为 1 和 4 的两行排名相同,它们的 RANK()
函数的返回值都是 1,但是 DENSE_RANK()
函数的返回值都是 1,下一个排名将会紧随在它们后面。而对于 id 为 3、5 和 2 的三行,它们的排名是不同的。
综上所述,RANK()
和 DENSE_RANK()
的主要区别就在于它们处理并列排名的方式不同。如果需要让排名紧密连续,可以使用 DENSE_RANK()
;如果需要跳过相同排名的行,可以使用 RANK()
。