hive 优化配置

最新推荐文章于 2024-06-13 10:30:00 发布

qqpy789

最新推荐文章于 2024-06-13 10:30:00 发布

阅读量249

点赞数

本文链接：https://blog.csdn.net/qqpy789/article/details/72730839

版权

set hive.cli.print.current.db=true;
set hive.exec.mode.local.auto=ture;
set hive.cli.print.header=true;
set hive.map.aggr=true;
set hive.groupby.skewindata=true;
set hive.optimize.skewjoin=true;
set hive.optimize.skewjoin.compiletime=true;
set hive.exec.compress.output=true;
set hive.exec.compress.intermediate=true;
set mapred.map.output.compression.codec=org.apache.hadoop.io.compress.SnappyCodec;
set mapred.output.compression.codec=org.apache.hadoop.io.compress.SnappyCodec;
set mapred.output.compression.type=BLOCK;
set hive.exec.parallel=true;
set hive.merge.mapfiles=true;
set hive.merge.mapredfiles=true;
set hive.auto.convert.join=true;
set hive.cbo.enable=true;
set hive.vectorized.execution.enabled = true;
set hive.vectorized.execution.reduce.enabled = true;
set mapred.job.reuse.jvm.num.tasks=10;
set hive.optimize.index.filter=true;

set hive.exec.reducers.max=50;

具体为什么要作这些配置请查看官网配置

https://cwiki.apache.org/confluence/display/Hive/Configuration+Properties

我总结一下吧,效果最明显的就是

1.tez引擎或者是spark引擎

2.使用压缩和使用orc文件格式

3.剩余的就比较分散了

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

qqpy789

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
hive 优化配置

set hive.cli.print.current.db=true;set hive.exec.mode.local.auto=ture;set hive.cli.print.header=true;set hive.map.aggr=true;set hive.groupby.skewindata=true;set hive.optimize.skewjoin=true;
复制链接

扫一扫