【大数据Hive】hive select 语法使用详解

本文详细介绍了Hive的SELECT语法,包括数据准备、常用语法、DISTINCT关键字、分区查询、GROUP BY、HAVING、LIMIT、UNION、子查询以及CTE等内容。通过实际操作演示,讲解了如何进行数据查询、分组聚合、去重、联接查询等,适合Hive初学者和开发者参考。
摘要由CSDN通过智能技术生成

目录

一、前言

二、Hive select 完整语法树

三、Hive select 操作演示

3.1 数据准备

3.1.1 创建一张表

3.1.2 将数据load加载到t_usa_covid19表

3.1.3 再创建一张分区表

3.1.4 使用动态分区插入数据

3.2 select 常用语法

3.2.1 查询所有字段或者指定字段

3.2.2 查询匹配正则表达式的所有字段

3.2.3 查询当前数据库

3.2.4 查询使用函数

3.2.5 使用函数

3.3 distinct关键字

3.3.1 查询state字段并去重

3.3.2 多个字段distinct 整体去重

3.4 分区查询、分区裁剪

3.5 GROUP BY

3.5.1 GROUP BY 概念

3.5.2 hive中 GROUP BY 使用限制

3.6 HAVING

3.7 limit

3.7.1 返回结果集的前5条

3.7.2 分页查询

3.8 HAVING与WHERE区别

3.9 select 语句中关键字顺序总结

四、union 

4.1 操作演示

4.1.1 使用union查询student_local和student_hdfs

4.1.2 使用ALL关键字会保留重复行

4.1.3 union之前的的表需要排序或者限制表的查询数量

五、子查询

5.1 where子句中子查询

5.1.1 不相关子查询

5.1.2 相关子查询

六、CTE

6.1 操作演示

6.1.1 CTE结合insert使用

6.1.2 CTE 其他用法

七、join关联查询

7.1 hive join语法树

关于语法树中关键参数说明

7.2 join语法丰富化

7.2.1 隐式联接表示法

7.2.2 非等值连接

7.3 hive join操作演示

7.3.1 数据准备

7.3.2 加载数据到表中

7.3.3 inner join 内连接

7.3.4 left join 左连接

7.3.5 right join 右连接

7.3.6 full outer join 全外连接

7.3.7 left semi join 左半开连接

7.3.8 cross join 交叉连接

7.3.9 关于 join使用 注意事项

八、写在文末


一、前言

由于Hive是基于Hadoop的数据仓库,是面向分析支持分析工具。将已有的结构化数据文件映射成为表,然后提供SQL分析数据的能力。因此在Hive中常见的操作就是分析查询select操作。

Hive早期是不支持update和delete语法的,因为Hive所处理的数据都是已经存在的的数据、历史数据。后续Hive支持了相关的update和delete操作,不过有很多约束。详见Hive事务的支持。

二、Hive select 完整语法树

看hive的select语法树,对于熟悉mysql的同学是不是觉得里面有些关键词比较熟悉,在hive的select 语法中,尤其值得注意的就是from后面的内容,表示从哪里获取数据,可以是普通物理表、视图、join结果或子查询结果;

[WI
评论 161
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

逆风飞翔的小叔

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值