公众号: 数据小斑马,关注即可获得价值1000元的数据分析学习资料
SQL系列目录(文末有大礼赠送
):
SQL技巧初级系列①—建表/更新表/删除表
SQL技巧初级系列②—聚合和排序(group by,having,order by)
SQL技巧初级系列③——数据拼接(集合运算union和列连接join)
SQL技巧中级系列①——字符串函数的使用
SQL技巧中级系列②——日期函数的使用
SQL技巧高级系列②——聚合函数和CASE WHEN的使用
在窗口分析函数出现之前,存在很多 SQL 难以解决的问题,很多都要通过复杂的相关子查询完成,或到Excel中用函数处理
2003年ISO SQL标准加入了窗口分析函数,使得这些难题轻松被攻克,大大提升了效率,减少了Excel卡死导致前功尽弃的情况
本文从聚合/排序/极值/移动/切片五大场景来讲解窗口分析函数
窗口分析函数,可以指定数据窗口进行统计分析,它和普通聚合函数的区别:
① 窗口函数对每个组返回多行,而聚合函数对每个组只返回一行
② 窗口函数指定了分析函数工作的数据窗口大小,这个数据窗口大小可能会随着行的变化而变化,而聚合函数是针对所有数据进行统计
窗口函数写法:
函数( ) over (partition by 列名2 order by 列名3 rows between n/unbounded preceding and m following/current row )
函数( ) ——按列名进行统计,排序可以不写列名
partition by——按列名进行分组,如果不指定partition by,则不需要分组
order by——按列名进行排序,如果不指定order by,则将分组内所有值累加
rows_between——限定统计窗口大小,如果不指定rows between,默认从起点到当前行
① preceding:往前
② following:往后
③ current rows:当前行
④ unbounded preceding:起点行
⑤ unbounded following:终点行
⑥ rows between unbounded preceding and current row 是最常用的定位框架,可以省略
有了初步的语法了解,下面以某店铺2019年的销量为例来讲解五大应用,表名为 sale_detail,你准备好了吗?
一、聚合
公众号: 数据小斑马,关注即可获得价值1000元的数据分析学习资料
1、店铺19年总销量(sum)
sum是求和,over()没有参数,则对所有数据进行求和,输出的结果都是5800
select a.*, sum(sale)over() as total_sale from sale_detial a
2、店铺19年每个level总销量(sum)
用level分组求和,则每个level的输出结果一致
select a.*,
sum(sale)over() as total_sale,
sum(sale)over(partition by level) as level_sale from sale_detial a