【大数据入门核心技术-Hive】(九)HiveSQL数据查询

目录

一、SELECT语法

1、基本语法

2、全表查询

3、选择特定列查询

4、列别名

5、常用聚合函数

6、LIMIT语句

​​​​​​​7、WHERE语句

二、运算符

​​​​​​​1、比较运算符

2、实操举例

3、LIKE和RLIKE

4、逻辑运算符

三、分组

1、GROUP BY语句

​​​​​​​2、HAVING语句

3、案例实操

​​​​​​​四、JOIN语句

​​​​​​​1、内连接(INNER JOIN)​​​​​​​

​​​​​​​2、左外连接(LEFT OUTER JOIN)

​​​​​​​​​​​​​​3、右外连接(RIGHT OUTER JOIN)

​​​​​​​4、满外连接(FULL OUTER JOIN)

​​​​​​​​​​​​5、多表连接

五、排序

1、Order By-全局排序

2、​​​​​​​Sort By-每个MapReduce内部局部排序

​​​​​​​3、Distribute By-分区排序

​​​​​​​4、Cluster By


一、SELECT语法


1、基本语法


SELECT [ALL | DISTINCT]select_expr, select_expr, ...
FROM table_reference
[WHERE where_condition]
[GROUP BY col_list]
[HAVING where_condition]
[ORDER BY col_list]
[CLUSTER BY col_list
  | [DISTRIBUTE BY col_list] [SORT BY col_list]
]
[LIMIT number]

参数说明
1、ORDER BY用于全局排序,就是对指定的所有排序键进行全局排序,使用ORDER BY的查询语句,最后会用一个Reduce Task来完成全局排序。

2、sort by用于分区内排序,即每个Reduce任务内排序。,则sort by只保证每个reducer的输出有序,不保证全局有序。

3、distribute by(字段)根据指定的字段将数据分到不同的reducer,且分发算法是hash散列。

4、cluster by(字段) 除了具有Distribute by的功能外,还兼具sort by的排序功能。。

因此,如果distribute by和sort by字段是同一个时,此时,cluster by = distribut

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

forest_long

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值