HiveSQL或SparkSQl中group by与grouping sets、with cube和with rollup用法演示

本文通过实例详细讲解了HiveSQL和SparkSQL中group by、grouping sets、with cube和with rollup的用法,包括它们在数据聚合和多维度分析中的应用,并通过示例数据对比了它们之间的区别和等价关系。
摘要由CSDN通过智能技术生成

GROUPING SETS: 根据不同的维度组合进行聚合,等价于将不同维度的GROUP BY结果集进行UNION ALL
数据准备:

建表语句:
create table tmp.gb(
a string,
b string,
c int
)row format delimited fields terminated by '\t' stored as textfile;
案例数据:
1 1 1
2 1 2
2 2 2
2 2 3
2 1 2
1 2 2

使用案例:

第一种组合:
select a,b,sum(c) from gb group by a,b grouping sets(a);
1 NULL 3
2 NULL 9
第二种组合:
select a,b,sum(c) from gb group by a,b grouping sets(b);
NULL 1 5
NULL 2 7
第三种组合:
select a,b,sum(c) from gb group by a,b grouping sets(a,b);
NULL 1 5
NULL 2 7
1 NULL 3
2 NULL 9
第四种组合:
select a,b,sum(c) from gb group by a,b grouping sets((a,b));
1 1 1
1 2 2
2 1 4
2 2 5
第五种组合:
select a,b,sum(c) from gb group by a,b

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值