Hive开启mapjoin优化、并行执行、动态分区

最新推荐文章于 2024-04-13 10:34:23 发布

攻城狮Kevin

最新推荐文章于 2024-04-13 10:34:23 发布

阅读量3.9k

点赞数

分类专栏： Hive 文章标签： Hive

本文链接：https://blog.csdn.net/wx1528159409/article/details/89564328

版权

Hive 专栏收录该内容

66 篇文章 17 订阅

订阅专栏

mapjoin优化适合小表join大表

set hive.optimize.skewjoin=true; //有数据倾斜时开启负载均衡，默认false
set hive.auto.convert.join=true; //设置自动选择MapJoin，默认是true
set hive.auto.convert.join.noconditionaltask=true; //map-side join
set hive.auto.convert.join.noconditionaltask.size=100000000; //多大的表可以自动触发放到内层LocalTask中，默认大小10M
set hive.mapjoin.smalltable.filesize=200000000; //设置mapjoin小表的文件大小为20M，小表阈值

开启并行执行

set hive.exec.parallel=true; //可以开启并发执行
set hive.exec.parallel.thread.number=16; //同一个sql允许最大并行度，默认为8。

开启动态分区

set hive.exec.dynamic.partition=true;
set hive.exec.dynamic.partition.mode=nonstrict;

攻城狮Kevin

关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
2
评论
Hive开启mapjoin优化、并行执行、动态分区

mapjoin优化适合小表join大表set hive.optimize.skewjoin=true; //有数据倾斜时开启负载均衡，默认falseset hive.auto.convert.join=true; //设置自动选择MapJoin，默认是trueset hive.auto.convert.join.noconditionaltask=true; //map-side joi...
复制链接

扫一扫

专栏目录