什么是窗口函数?
需要在每组内排名时,例如每个部门按照业绩来排名,可以使用SQL的窗口函数功能。和GROUP BY 不同,窗口函数不会减少数据的行数,窗口函数基本语法如下:
<窗口函数> over (partition by <用于分组的别名> order by <用于排序的列名>)
1. 专用窗口函数
- rank()
- dense_rank()
- row_number()
他们的区别是碰到相同大小的值得时候,编号的方式不同,分别形如: - 1,1,1,4,5…
- 1,1,1,2,3…
- 1,2,3,4,5…
SELECT Score,
DENSE_RANK() OVER(PARTITION BY Department ORDER BY Score DESC) AS "Rank"
FROM Scores;
除此之外还有lag and lead, 用于把指定列向前或向后移动多少行后和原表拼接。
lag(column, n, default)
其中default表示默认值,不给就是NULL
SELECT gid,
lag(time, 1, '0') over (partition by gid order by time) as lag_time
from user_order;
在LEEDCODE连续出现的数字中用到了这样的窗口函数
SELECT DISTINCT c.NUM AS "ConsecutiveNums" FROM (
SELECT Num,
lead(Num,1) OVER () AS "lead1",
lead(Num,2) OVER () AS "lead2" FROM Logs) AS c
WHERE c.Num = c.lead1 AND c.lead1 = c.lead2;
2. 聚合函数
聚合函数后面括号里面不能为空,需要指定聚合的别名。
- avg()
- sum()
- count()
- max()
- min()
SELECT *,
SUM(Grades) OVER(ORDER BY Name) as current_sum;
以上函数用在窗口函数时,统计的是截止到本行数据,统计数据是多少。同时可以看出每一行数据对整体统计数据的影响。如果想要看所有数据的统计值,看最后一行即可。
还是这个神一点,后面用到的话慢慢补充
大神学习记录