- 窗口函数也叫做开窗函数,其最大的特点是输入值是从select语句的结果集中的一行或者“多行”窗口中获取的
- 如果函数具有over()子句,则说明它是窗口函数
- 窗口函数可以简单的解释为类似于聚合函数的计算函数,但是通过group by子句组合的常规聚合会隐藏正在聚合的各个行,最终输出一行,窗口函数聚合后还可以访问当中的各个行,并且可以将这些行中的某些属性添加到结果集中
- 语法规则:
- 以sum函数举例窗口函数,注意是整体聚合还是累积聚合
- sum(...) over():对表所有行求和
- sum(...) over(order by...):连续累积求和
- sum(...) over(partition by...):同组内所有行求和
- sum(...) over(partition by... order by...):在每个分组内,连续累积求和
- 窗口表达式:(1)在sum(...) over(partition by... order by...)语法完整的情况下,进行累积聚合操作,默认累积聚合行为是从第一行聚合到当前行
(2)Window expression窗口表达式给我们提供了一种控制行范围的能力,语法如下:
- 窗口排序函数—row_number家族
- row_number():在每个分组中,为每行分配一个从1开始的唯一序列号,递增,不考虑重复
- rank():在每个分组中,为每行分配一个从1开始的序列号,考虑重复,挤占后续位置
- dense_rank():在每个分组中,为每行分配一个从1开始的序列号,考虑重复,不挤占后续位置
- 窗口分析函数:(1)lag(col,n,default):用于统计窗口内往上第n行值。其中第一个参数为列名,第二个参数为往上第n行(可选,默认为1),第三个参数为默认值(当往上第n行为NULL的时候,取默认值,如不指定,则为NULL)
(2)lead(col,n,default):用于统计窗口内往下第n行值
(3)first_value:取分组内排序后,截止到当前行,第一个值
(4)last_value: 取分组内排序后,截止到当前行,最后一个值