Hive sql分组函数grouping sets、cube、rollup用法简介

最新推荐文章于 2023-10-29 00:35:41 发布

xiaoxaoyu

最新推荐文章于 2023-10-29 00:35:41 发布

阅读量4k

点赞数 3

分类专栏： Hive SQL 文章标签： hive sql

本文链接：https://blog.csdn.net/xiaoxaoyu/article/details/123941043

版权

Hive 同时被 2 个专栏收录

16 篇文章 0 订阅

订阅专栏

SQL

14 篇文章 0 订阅

订阅专栏

文章目录

1、数据如下：

user_id,dep_id,group_id,salary
10001,a,101,13000
10002,a,101,17000
10003,a,101,9000
10004,a,101,11000
10005,a,101,18000
10006,a,102,16000
10007,a,102,10000
10008,b,103,18000
10009,b,103,11000
10010,b,103,16000
10011,b,103,12000
10012,c,104,16000
10013,c,105,18000
10014,c,105,18000
10015,c,106,12000
10016,c,106,14000
10017,c,106,14000
10018,c,106,9000
10019,c,106,8000
10020,c,106,9000
10021,c,106,10000

2、建表如下：

create external table test.salaryinfo(
user_id string,
dep_id string,
group_id string,
salary int
)
row format delimited
fields terminated by ','
stored as textfile
location '/test'
tblproperties("skip.header.line.count"="1")
;

请添加图片描述

3、grouping sets

在一个GROUP BY查询中，根据不同的维度组合进行聚合，等价于将不同维度的GROUP BY结果集进行UNION ALL

按照dep_id,group_id两个字段分别分组

select dep_id,group_id,count(1)
from salaryinfo
group by dep_id,group_id
grouping sets (dep_id,group_id)
;

请添加图片描述

按照dep_id,group_id两个字段以及以及(dep_id,group_id)组合起来分别分组

select dep_id,group_id,count(1)
from salaryinfo
group by dep_id,group_id
grouping sets (dep_id,group_id,(dep_id,group_id))
;

请添加图片描述

grouping__id表示结果属于哪一个分组集合，一般用来排序，看上去更清晰

select dep_id,group_id,count(1),grouping__id
from salaryinfo
group by dep_id,group_id
grouping sets (dep_id,group_id)
;

请添加图片描述

4、cube

根据GROUP BY的维度的所有组合进行聚合，和grouping sets类似，只不过grouping sets更加自定义，可以根据需求来；cube是所有的分组组合

以下SQL等于分组字段分别为以下4种的union all

分组字段为空，即整张表的聚合
分组字段为dep_id
分组字段为group_id
分组字段为dep_id,group_id

select dep_id,group_id,count(1),grouping__id
from salaryinfo
group by dep_id,group_id
with cube
order by grouping__id
;

请添加图片描述

5、rollup

是CUBE的子集，以最左侧的维度为主，从该维度进行层级聚合

select dep_id,group_id,count(1),grouping__id
from salaryinfo
group by dep_id,group_id
with rollup
order by grouping__id
;

请添加图片描述

select dep_id,group_id,count(1),grouping__id
from salaryinfo
group by group_id,dep_id
with rollup
order by grouping__id
;

请添加图片描述

xiaoxaoyu

关注

3
点赞
踩
15

收藏

觉得还不错? 一键收藏
0
评论
Hive sql分组函数grouping sets、cube、rollup用法简介

文章目录1、数据如下：2、建表如下：3、grouping sets4、cube5、rollup1、数据如下：user_id,dep_id,group_id,salary10001,a,101,1300010002,a,101,1700010003,a,101,900010004,a,101,1100010005,a,101,1800010006,a,102,1600010007,a,102,1000010008,b,103,1800010009,b,103,1100010010,b,
复制链接

扫一扫