hive学习笔记3：group by子句

最新推荐文章于 2024-05-14 09:07:11 发布

zhousishuo

最新推荐文章于 2024-05-14 09:07:11 发布

阅读量2.5k

点赞数

分类专栏： hql hive 文章标签： hive group-by

本文链接：https://blog.csdn.net/zhousishuo/article/details/79148983

版权

hive 同时被 2 个专栏收录

7 篇文章 1 订阅

订阅专栏

hql

4 篇文章 0 订阅

订阅专栏

1.按照性别来计算不同的用户数

SELECT pv_users.gender, count(DISTINCT pv_users.userid)
FROM pv_users
GROUP BY pv_users.gender;

2.使用GROUP BY时，可以同时使用多个聚合函数，但是聚合函数里面使用DISTINCT时必须包含相同的列

SELECT pv_users.gender, count(DISTINCT pv_users.userid), count(*), SUM(DISTINCT pv_users.userid)
FROM pv_users
GROUP BY pv_users.gender;

3.下面写法就是错误的，因为不允许相同的查询中包含多个不同的DISTINCT表达式

SELECT pv_users.gender, count(DISTINCT pv_users.userid), count(DISTINCT pv_users.ip)
FROM pv_users
GROUP BY pv_users.gender;

4.Select语句和group by子句
使用group by子句，select语句中只能包含group by的子句。当然，也可以使用聚合函数

SELECT 
    a,
    sum(b)
FROM
    t1
GROUP BY
    a;

但是下面的语句就不可以

SELECT
    a,
    b
FROM
    t1
GROUP BY
    a;

5.对于Group By的Map端聚合
hive.map.aggr控制了如何聚合。默认设置是false，如果设置为true，Hive将会在map任务中直接做第一优先级的聚合。这样通常提供更好的效率，但是可能需要更多的内存来成功运行。

set hive.map.aggr = true;
SELECT COUNT(*) FROM table2;

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

zhousishuo

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
hive学习笔记3：group by子句

hive group by
复制链接

扫一扫

专栏目录

hive group by join 优化

OH LEI``

05-25

3432

group by 查询:1、遇到group by查询时，会按照group by的键进行分发。2、distinct与group by实现原理类似。group by优化：1、map端数据聚合，执行sql前先执行set hive.map.aggr=true2、针对倾斜的key做两道作业的聚合，set hive.groupby.skewindata=true。join 查询：1、将小表写在join的左边，...

Hive group by操作

lavimer

01-28

2万+

Hive中常见的高级查询有：group by、Order by、join、distribute by、sort by、cluster by、Union all。今天我们就来谈谈group by操作，group by操作表示按照某些字段的值进行分组，有相同的值放到一起，语法样例如下： select col1,col2,count(1),sel_expr(聚合操作) from tableName w

参与评论您还未登录，请先登录后发表或查看评论

Hive的group by

最新发布

早拾碗吧的博客

05-14

337

【代码】Hive的group by。

Hive之GROUP BY详解

LZW760907的博客

05-11

640

一，GROUP BY 执行理解先来看下表1，表名为test：表1 　　执行如下SQL语句： SELECT name from test GROUP BY name ; 你应该很容易知道运行的结果，没错，就是下表2：表2 　　可是为了能够更好的理解“group by”多个列“和”聚合函数“的应用，我建议在思考的过程中，由表1到表2的过程中，增加一个虚构...

hive group by 的高级用法

weixin_40809627的博客

11-12

1970

roup by 作为一种分组查询，在sql中用处十分广泛。

Hive-2.HiveQL查询中where和group by语句

艾文

01-27

5212

1. WHERE语句查询英语成绩大于等于70的列表： select name,ceil(salary) as salary,age from employees where score['English']>=70; 输出结果： name salary age wangwu1 5500 20 wangwu3 8400 20 wangwu4 8400 20

hive学习笔记精华版

10-08

【Hive学习笔记精华版】 Hive是大数据处理领域中的一款重要工具，它基于Hadoop构建，主要用于数据仓库和数据分析。作为一个离线处理系统，Hive可以将结构化的数据文件映射成数据库表，允许用户使用类似SQL的查询...

hive学习笔记

01-10

自己在大数据培训班学习整理的笔记，比较详细，适合新手学习，我感觉还是挺有帮助的，希望可以帮助到你

尚硅谷大数据技术hive学习笔记

10-27

"尚硅谷大数据技术hive学习笔记" Hive 是一个基于 Hadoop 的数据仓库工具，可以将结构化的数据文件映射为一张表，并提供类 SQL 查询功能。 Hive 的核心是将 HQL 转化成 MapReduce 程序，通过 SQL 语言中常用的操作...

Hive学习笔记

04-01

3. **Hive 注释**： - 在 HiveQL 中，可以使用 `--` 或 `/*...*/` 来添加单行或多行注释。 4. **Hive 数据集合类型**： - Hive 支持多种数据类型，包括基本类型如整型、浮点型、字符串，以及复杂类型如数组、...

第六章 hive的简单查询（where ，groupby，join，order by等）

张国荣家的弟弟

12-08

1237

文章目录6.1基本查询6.1.1创建部门表6.1.2 列别名6.1.3 算术运算符6.1.4 常用函数6.2 where 语句6.2.1 比较运算符（Between/In/ Is Null）6.2.2 Like和RLike6.2.3 逻辑运算符（And/Or/Not）6.3 分组6.3.1 Group By语句6.3.2 Having语句6.4 Join语句6.4.1 等值Join6.4.2 表的别名6.4.3 内连接6.4.4 左外连接6.4.6 满外连接6.4.7 多表连接6.4.8 笛卡尔积6.5 排

hive之group by详解

热门推荐

我的博客

05-10

5万+

有部分是转自:https://blog.csdn.net/lzm1340458776/article/details/43230517hive distribute by 和group by 的区别：group by是对检索结果的保留行进行单纯分组，一般总爱和聚合函数一块用例如AVG（），COUNT（），max（），main（）等一块用。 group by操作表示按照某些字段的值进行分组，有相同的...

HiveQL常用查询语句where、group by、having、join子句记录

攻城狮Kevin

02-28

4960

由于hivesql中查询语句时，常用查询条件比较多，所以专门写一篇博文对HiveQL的查询语句进行总结，理清联系和区别。目录 1. where子句（不能跟别名）（1）比较运算符（2）like和rlike（正则匹配）（3）逻辑运算符and or not 2. group by子句（每...） 3. having子句（只用于group by之后） 4. join子句（A joi...

hive和mysql中where/group by/order by后跟别名的区分

攻城狮Kevin

10-08

1617

由于where和group by的执行顺序都在select之前，所以select的别名不可以跟在其之后，order by的执行顺序在select之后，所以order by后可以跟select的别名。两者的区别在于：hivesql中group by后不可跟别名，而mysql中group by后可以跟别名；2. group by和partition by后不可跟别名。1. order by后可以跟别名。1. order by后可以跟别名。2. group by后可以跟别名。3. where后不可跟别名。

hive GroupBy操作(翻译自Hive wiki)

weixin_34415923的博客

01-09

138

Group By 语法 groupByClause: GROUP BY groupByExpression (, groupByExpression)* groupByExpression: expression groupByQuery: SELECT expression (, expression)* FROM src groupByClause? 简单...

6.Hive基础—查询—基本查询(函数、Limit、Where等)、分组(Group By、Having)、Join语句(连接)、排序

页川叶川

08-19

812

本文目录如下：第6章查询6.1 基本查询（Select…From）6.1.1 全表和特定列查询6.1.2 列别名6.1.3 算术运算符6.1.4 常用函数6.1.5 Limit 语句6.1.6 Where 语句6.1.7 比较运算符（Between/In/ Is Null）6.1.8 Like 和 RLike6.1.9 逻辑运算符（And/Or/Not）6.2 分组6.2.1 Group By 语句6.2.2 Having 语句6.3 Join 语句6.3.1 等值 Join6.3.2 表的别名6.3.3

hive中的group by分组查询注意和其他其他传统关系数据库sql的区别

qq_39954916的博客

03-31

2084

顾名思义就是按照指定的一个或者多个字段就行分组查询，返回每个组的相关值，group by时常与聚合函数结合使用，这里需要注意的是， 1、在hive中，一旦有group by子句，那么，在select子句中只能有分组字段，聚合函数以及值是唯一的字段。否则会提示Expression not in GROUP BY key '不应该在select中的字段名'。想想，如果一个字段的值的水平不止...

【Hive---12】窗口函数『窗口函数与group by 区别 | 窗口聚合函数 | 窗口排名函数 | 窗口分析函数』

渐渐的忘记，赶不上明天（读研ing，2024年毕业）

12-15

1978

1. 概述 1.1 窗口函数的partition by与group by 的分组有什么区别？ 1.2 窗口函数的order by + order by 的排序有区别吗？ 2. 语法 2.1 哪些函数可以开窗变为窗口函数？ 2.2 语法 ---- 关于order by 的一个坑关于窗口函数是否可以嵌套 3. 窗口聚合函数 3.1 sum()窗口函数的一个注意点 3.2 例子 4. 窗口排名函数 4.1 求TopN 4.2 求几分之几 5 窗口分析函数 6. 关于窗口函数的一些思考

C++空指针

waponx的专栏

02-20

1609

空指针：从通俗的角度讲就是一个没有指向任何对象的指针，具体的定义为：“一个能求出0值的常量表达式（例如：0， 3-3, 0L）被转换为一个指针，通常称为空指针。这个值所产生的指针将保证能与任何对象或者函数的指针相互区分。” 需要注意的是，空指针并不一定用与整数0一样的二进制模式表示。常见的误解是：许多人认为，既然p = 0给指针p赋了空指针值，那么空指针的表示就必然和整数0一样，就是说是一个全0

“相关推荐”对你有帮助么？

非常没帮助
没帮助
一般
有帮助
非常有帮助

提交