场景
在编写报表的 sql 脚本的时候,可能会遇到多维度组合的情况,例如下面的情况。常规的做法是编写不同维度组合的 sql ,然后再使用 union all 进行全集(当分组维度数量比较多的时候,union的sql代码会非常长)。但你若熟悉下面几种方法就简洁多了。
一、group by
group by:主要用来对查询的结果进行分组,相同组合的分组条件在结果集中只显示一行记录。使用group by从句时,通过添加聚合函数(主要有COUNT()、SUM、MAX()、MIN()等)可以使数据聚合。
二、grouping setsgrouping sets是group by子句更进一步的扩展,它让你能够定义多个数据分组。这样做使聚合更容易,并且因此使得多维数据分析更容易。
用grouping sets在同一查询中定义多个分组。
grouping sets:对分组集中指定的组表达式的每个子集执行group by,group by A,B grouping sets(A,B)就等价于 group by A union group by B;其中A和B也可以是一个集合,比如group by A,B,C grouping sets((A,B),(A,C))。
三、with rolluprollup 是根据维度在数据结果集中进行的聚合操作。
group by A,B,C with rollup 首先会对(A、B、C)进行group by,然后对(A、B)进行group by,然后是(A)进行group by,最后对全表进行group by操作。可以看出 group by A,B,C with rollup;是上述几种group by 的并集。
rollup:在指定表达式的每个层次级别创建分组集。
四、with cube为指定表达式集的每个可能组合创建分组集。首先会对(A、B、C)进行group by,然后依次是(A、B),(A、C),(A),(B、C),(B),(C),最后对全表进行group by操作。
在以上几种方法的选择上要根据具体分组统计情况而定。