面试常考题。之后每天更新一部分。今天先介绍 where。
欢迎点击此处关注公众号。
Hive SQL 语法本质上分为 3 类:过滤模式、聚合模式、连接模式。
- 过滤模式:例如 where、having 等;
- 聚合模式:存在 Shuffle 过程,需要特别注意;
- 连接模式:分为有 Shuffle 连接和无 Shuffle 连接。
1.过滤模式
1.1 where 子句过滤
例:
select *
from stu_tb
where age=19 and name like '%红%' and score_in (100, 50, 22);
where 的过滤操作发生在 Map 阶段。计算逻辑发送到数据所在的所有机器中执行,实现并行计算,