Hive高阶函数之CUBE，GROUPING SETS，ROLLUP函数

最新推荐文章于 2022-08-29 22:36:23 发布

遥遥晚风点点

最新推荐文章于 2022-08-29 22:36:23 发布

阅读量707

点赞数

分类专栏： Hive 文章标签： hive

本文链接：https://blog.csdn.net/mr_ye931/article/details/108476763

版权

Hive 专栏收录该内容

11 篇文章 0 订阅

订阅专栏

应用场景

将所有的维度排列组合在一块

WITH CUBE

会组合所有维度，比如有n个维度，一共排列出2^n种组合查询
缺点：会产生大量无意义的组合

SELECT province, city, devicetype, count(distinct guid) as uv_amt
FROM  tmp
GROUP BY province,city,devicetype
WITH CUBE;

GROUPING SETS(...)

可以自定义组合维度,()代表最粗粒度的组合

SELECT province, city, devicetype, count(distinct guid) as uv_amt
FROM  tmp
GROUP BY province,city,devicetype
GROUPING SETS((),(province),(province,city),(province,devicetype),(province,city,devicetype));

WITH ROLLUP

如果数据中，所有维度都属于一个层级关系链条，比如省-->市--->区，使用这种函数更简便高效

SELECT province, city, region, street, sum(score) as socre_amt, max(score) as score_max
GROUP BY province,city,region,street
with rollup;

过滤掉不需要查询的维度：

使用coalesce()函数：返回第一个不为空的值，如果所有值都为空，则返回null。

例子：不查询account和score这两个维度

select
*
from dwd.device_account_log t
where COALESCE(t.account,t.score) is null;

设置最大维度基数（默认30个）：

set hive.new.job.grouping.set.cardomality=n

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

遥遥晚风点点

关注关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Hive多维分析函数——With cube、Grouping sets、With rollup

爱吃辣条的博客

07-28

709

Hive多维分析函数——With cube、Grouping sets、With rollup

Hive高级聚合函数——group by扩展

shuizimuzhongling的专栏

12-05

1143

目录 Grouping Sets 指定多种聚合的维度、层次，对多个group by + union all进行替换、简化 With Rollup 可实现从右到左递减多级的统计，显示统计某一层次结构的聚合 With cube 可以实现多个任意维度的查询，会统计所选列中值的所有组合的聚合 Grouping__id 按照一定规则给统计的各维度组合打标，并返回标识值...

参与评论您还未登录，请先登录后发表或查看评论

mysql中的cube和rollup_【hive】cube和rollup函数

weixin_42468901的博客

01-27

748

cube数据立方体(Data Cube)，是多维模型的一个形象的说法.(关于多维模型这里不讲述,在数据仓库设计过程中还挺重要的,有兴趣自行查阅)立方体其本身只有三维，但多维模型不仅限于三维模型，可以组合更多的维度为什么叫数据立方体?一方面是出于更方便地解释和描述，同时也是给思维成像和想象的空间；另一方面是为了与传统关系型数据库的二维表区别开来下图为数据立方体的形象图其实并不用把cube理解得很高大...

hive 函数 Cube

a45691316的博客

04-28

415

hive 函数 Cube 最近在优化一个报表系统。leader 提示我可以用cube函数。在此记录一下使用： 1） cube 简称数据魔方。可以实现hive多个任意维度的查询。 cube(a,b,c) 首先会对(a,b,c)进行group by，然后依次...

【CUBE】Oracle分组函数之CUBE魅力

cuanchuwei1207的博客

04-23

720

Oracle的CUBE与ROLLUP功能很相似，也是在数据统计分析领域的一把好手。关于ROLLUP的查询统计功能请参考文章《【ROLLUP】Oracle分组函数之ROLLUP魅力》（http://space.i...

【ROLLUP】Oracle分组函数之ROLLUP魅力

cuanchuwei1207的博客

04-21

1244

本文通过演示给出Oracle ROLLUP分组函数的用法，体验一下Oracle在统计查询领域中的函数魅力。ROLLUP分组函数可以理解为Group By分组函数封装后的精简用法，这里同时给出ROLLUP的...

hive 中的grouping set，cube，roll up函数

weixin_34352449的博客

09-12

2256

2019独角兽企业重金招聘Python工程师标准>>> ...

《yiee数据运营系统》OLAP扩展知识汇总：立方体与Hive高级函数

二、Hive高阶聚合函数 - with cube函数：与Cube函数类似，但可能更适合在Hive中使用，提供更精细的控制。 - grouping sets函数：允许用户定义多个分组级别，适用于更复杂的分组需求。 - with rollup函数：类似于...

Sql进阶技巧：如何进行多维分析？【高阶多维聚合函数应用】

石榴姐yyds

05-05

2501

本文详细分析了Hive中高阶多维聚合函数的使用，由以上分析可以看出，高阶聚合函数实质上是对多维统计采用UNION ALL实现的一种优化，其性能也比UNION ALL实现性能要高，往往作为一种优化手段使用。......

Hive 函数使用——窗口函数

weixin_48626604的博客

03-29

2054

Hive 函数使用 1. 常见的三种运算符关系运算符关系运算符是二元运算符，执行的是两个操作数的比较运算。每个关系运算符都返回boolean类型结果（true or false） •等值比较: = 、== •不等值比较: <> 、!= •小于比较: < •小于等于比较: <= •大于比较: > •大于等于比较: >= •空值判断: IS NULL •非空判断: IS NOT NULL •LIKE比较: LIKE •JAVA的LIKE操作: RLIKE •RE

Hive开窗函数测试-cube，rollup

04-19

NULL 博文链接：https://wankunde.iteye.com/blog/1879565

hive的 cube

u013219053的博客

11-12

538

hive的 cube 1.with cube 相当于group by 所有维度的union all 的集合 2.grouping sets 跟在 group by 子句后面，grouping_sets 相当于将聚合结果根据grouping_sets的算子进行二次聚合 ,并将所有聚合 union all . 注意：以（）为一个group by 算子集。并且外层（）不能漏 3.with rollup 跟在group by 后面，相当于grouping sets 从右到左依次递减算子作为一次group

Hive学习之路（十七）Hive分析窗口函数(五) GROUPING SETS、GROUPING__ID、CUBE和ROLLUP

mnasd的博客

07-29

709

目录概述数据准备数据格式创建表玩一玩GROUPING SETS和GROUPING__ID 说明查询语句查询结果结果说明再比如玩一玩CUBE 说明查询语句查询结果玩一玩ROLLUP 说明查询语句正文回到顶部概述 GROUPING SETS,GROUPING__ID,CUBE,ROLLUP ...

HIVE多维分析函数：grouping sets、cube、rollup

weixin_46429290的博客

08-29

3163

这里with cube就等同于grouping sets ((department,name,age),(department,name),(department,age),(department),(name,age),(name),(age),())HIVE的多维分析函数，配合group by 使用，通常的group by只能对单维度的字段进行分析聚合操作，如果想要获取不同组合字段的聚合操作，就需要写多个group by 组合，HIVE提供了内置的函数用于上述这种多维分析。...

Hive新功能 Cube, Rollup介绍

weixin_33862993的博客

01-07

290

说明：Hive之cube、rollup，还有窗口函数，在传统关系型数据（Oracle、sqlserver）中都是有的，用法都很相似。 GROUPING SETS GROUPING SETS作为GROUP BY的子句，允许开发人员在GROUP BY语句后面指定多个统计选项，可以简单理解为多条group by语句通过union all把查询结果聚合起来结合起来，下面是几个实例可以帮助我们了解，...

rollup函数_值得你深入了解的函数：SUMMARIZE

weixin_39905500的博客

11-24

560

SUMMARIZE函数非常强大，掌握以后表面上看也非常好用，所以我专门写篇文章介绍一下这个函数，至于是否一定要使用该函数，请看完再决定。SUMMARIZE，单纯从英文语义上看，是汇总、总结的意思，而它的功能，确实也就是汇总，它可以返回一个汇总表。你可以从官方的文档中查询到该函数的说明，https://docs.microsoft.com/en-us/dax/summarize-function-d...

rollup函数

hd_dream的专栏

10-15

245

前几天女朋友突然问我数据库中的rollup函数怎么样，一下子愣住的，没有听说过，有点惭愧啊！做开发的尽然让做测试的给问住了，感觉学习吧！ rollup是和group by一起使用的，是一个进行分组统计的时候的统计函数。举例说明：表：费用（fee）字段：类型（type），金额（money）现在需要根据类型统计金额，最后在把总金额计算出来，格式如下类型金额 1 ...

rollup函数（分组后对每组数据分别合计）

weixin_43915509的博客

06-02

4330

需求：sql通过分组查询后，对每组数据进行小计，然后对总的数据总计 rollup的作用：用 ROLLUP 汇总数据，在生成包含小计和合计的报表时，ROLLUP 运算符很有用。例子： SQL> select deptno,job,sum(sal) from emp group by deptno,job order by deptno; 2 单独使用分组查询 3 4 DEPTNO JOB SUM(SAL) 5 ------ --------- ---------- .

Hive全面函数指南：从基础到高级操作

"这篇文档是关于Hive常用函数的全面总结，涵盖了关系运算、数学运算、逻辑运算、数值计算以及日期函数等多个方面的内容。" 在Hive中，函数的使用是数据分析和查询的重要部分，以下是对这些函数的详细解释： 1. **...