开窗函数
开窗函数实际上是一种范围限定函数,将某种条件的集合限定在一个目标范围内,形象地称为窗口。在做SQL查询分析时与分析函数配合使用。
功能
我们在做SQL查询分析时通常会用到sum、count、average、min、max等函数或UDF。而这些函数通常与group by分组功能组合使用,用于在分组内聚合,聚合的结果返回一行记录。而开窗函数扩展了聚合分析,可通过指定窗口大小,让同一分组内返回多行记录(目标范围),窗口的大小决定着返回记录的多少,然后进行聚合分析得到结果。这大大提高了查询的灵活性和实用性。
OVER
开窗功能及窗口大小由OVER来指定。
- 窗口为分区内起点到当前行
OVER (PARTITION BY grid_id ORDER BY day ASC) 按照grid_id来分区,分区内按照day升序排列,这里的窗口为分区内从起点到当前行的记录。
- 窗口由range限定一个范围
OVER(ORDER BY high_speed RANGE BETWEEN 2 PRECEDING AND 2 FOLLOWING) 按照high_speed排序,窗口大小为一个范围区间[当前行值-2, 当前行值+2]。
- 窗口限定为往前N