点击关注上方“知了小巷”,
设为“置顶或星标”,第一时间送达干货。
Hive数据过滤之表过滤
hadoop-3.1.1
hive-3.1.1
Hive表:
hive> desc emp;
OK
empno int
ename varchar(10)
job varchar(9)
mgr int
hiredate date
sal float
comm float
deptno int
Time taken: 0.313 seconds, Fetched: 8 row(s)
Hive中的数据过滤
- where子句过滤
- having子句过滤
- distinct子句过滤
- 表过滤
- 分区过滤
- 分桶过滤
- 索引过滤
- 列过滤
表过滤
HiveSQL执行计划中,在Map阶段或者

本文介绍了Hive中的数据过滤,特别是表过滤技术,旨在减少重复读取同一表数据导致的IO资源浪费。通过from...select语句,可以实现一次读取多次使用,提高查询效率。同时,文章还提及了where、having、distinct等其他数据过滤方法。
最低0.47元/天 解锁文章
975

被折叠的 条评论
为什么被折叠?



