【Hive】常用的hive操作(HQL查询语法)

本文详细介绍了Hive的HQL查询语法,包括全表查询、选择特定列、列别名、常用函数(如count、max、min、sum、avg)、limit、where、like和rlike、逻辑运算符、分组(group by和having)、join(等值join、内连接、左连接、右连接和多表连接)以及排序(order by、sort by、distribute by、cluster by)。通过这些操作,读者可以深入理解并掌握Hive的数据处理能力。
摘要由CSDN通过智能技术生成

Hive系列学习笔记


非常重要!!!回忆一下SQL的执行顺序

from -> join -> on -> where -> group by -> avg,sum…
-> having -> select -> distinct -> order by-> limit

1 select

select [all | distinct] select_expr ....
from table_reference
[where ..]
[group by .. [having ..]] #分组
[cluster by  .. # 排序
| [distribute by .. ][sort by | order by ..]
]
[limit number]

1、order by:排序

对输入做全局排序,因此只有一个reducer,会导致当前输入规模较大时,需要较长的计算时间

2、sort by:分区内排序

不是全局排序,其在数据进入reducer之前完成排序,因此如果使用sort by进行排序并且设置marperd.reduce.tasks>1,则sort by只保证每个reducer的输出有序,不保证全局有序

3、distribute by:分区

根据指定的字段将数据分到不同的reducer,且分发算法是hash散列

4、cluster by:分区➕排序

除了具有distribute by的功能外,还会对该字段进行排序

当字段相同时,cluster by = sort by + distribute by

2 查询语法

2.1 全表查询

select * from score;

2.2 选择特定列

  • 3
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

快乐的冲浪码农

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值