优化hive的性能配置

最新推荐文章于 2024-06-07 16:33:33 发布

泥鳅812

最新推荐文章于 2024-06-07 16:33:33 发布

阅读量369

点赞数

分类专栏： DB tip

本文链接：https://blog.csdn.net/sinat_20174131/article/details/79970892

版权

tip 同时被 2 个专栏收录

48 篇文章 0 订阅

订阅专栏

28 篇文章 0 订阅

订阅专栏

-- 优化hive性能:tez,spark,lmpala,mapreduce; 矢量化--
set hive.execution.engine = spark;
set hive.vectorized.execution.enabled = true;
set hive.vectorized.execution.reduce.enabled = true;

## 别人的优化经验
#set hive.exec.compress.output=true;
#set mapred.output.compress=true;
#set mapred.output.compression.codec=org.apache.hadoop.io.compress.GzipCodec;
#set io.compression.codecs=org.apache.hadoop.io.compress.GzipCodec;
#set mapred.reduce.tasks=200;
#set mapreduce.reduce.shuffle.memory.limit.percent=0.10;
#set yarn.nodemanager.pmem-check-enabled=false;
#set yarn.nodemanager.vmem-check-enabled=false;
#set mapreduce.map.memory.mb=3072;
#set mapreduce.reduce.memory.mb=3072;

## ES的优化经验
#set hive.exec.dynamic.partition = true;
#set hive.exec.dynamic.partition.mode = nonstrict;
#set hive.exec.max.dynamic.partitions=10000;
#set hive.exec.max.dynamic.partitions.pernode=4000;
#set hive.mapred.reduce.tasks.speculative.execution=false;

## 书上的优化经验
set hive.auto.convert.join=true;
#set hive.exec.mode.local.auto=true;
#set hive.exec.parallel=true; #太吓人，禁止使用。

## 网上的优化经验
#set hive.groupby.skewindata=true;

## 自己的优化经验
#set hive.execution.engine = spark;
#set hive.vectorized.execution.enabled = true;
#set hive.vectorized.execution.reduce.enabled = true;

泥鳅812

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
优化hive的性能配置

-- 优化hive性能:tez,spark,lmpala,mapreduce; 矢量化--set hive.execution.engine = spark;set hive.vectorized.execution.enabled = true;set hive.vectorized.execution.reduce.enabled = true;
复制链接

扫一扫

专栏目录