1)Fetch 抓取是指:Hive 中对某些情况的查询可以不必使用 MapReduce 计算。
hive.fetch.task.conversion 默认是 more,老版本 hive 默认是 minimal,该属性修改为 more 以后,在全局查找、字段查找、limit 查找等都不走 mapreduce。
2)本地模式:设置hive.exec.mode.local.auto 的值为 true
3)开启MapJoin:set hive.auto.convert.join = true默认为true
大表小表的阈值设置(默认 25M 一下认为是小表)
set hive.mapjoin.smalltable.filesize=25000000;
4)开启 Map 端聚合参数设置
是否在 Map 端进行聚合,默认为 True :hive.map.aggr = true
在 Map 端进行聚合操作的条目数目hive.groupby.mapaggr.checkinterval = 100000
有数据倾斜的时候进行负载均衡(默认是 false)