hive生产中的参数配置——不同任务不同参数

本文主要介绍了在Hive生产环境中如何配置参数以优化任务性能。内容包括设置任务优先级、开启中间压缩、配置map和reduce端压缩、启用小文件合并、动态分区以及调整内存和CPU使用等关键参数。
摘要由CSDN通过智能技术生成

在脚本中hive-e后面直接设置:

--任务优先级别

set mapred.job.priority = NORMAL;


--开启中间压缩(map输出结果压缩,map端溢写时压缩后再传输)
set hive.exec.compress.intermediate = true

--设置map端压缩参数:决定压缩的两种:1. set hive的compress.output参数;2.表参数只适用于表存储格式为orc与parquet格式,tblproperties("orc.compress"=snappy")

set =true

set mapreduce.output.fileouputformat.compress.codec=org.apache.hadoop.io.compress.SnappyCodec

--设置reduce端压缩

set =true

set mapreduce.output.fileouputformat.compress.codec=org.apache.hadoop.io.compress.SnappyCodec


--在Map-Reduce的任务结束时合并小文件(从map到reduce
set hive.merge.mapredfiles = true;


--合并文件的大小,设置为块大小的两倍256M
set hive.merge.size.per.task = 256000000;


--当输出文件的平均大小小于该值时,启动一个独立的map-reduce任务进行文件merge
set hive.merge.smallfiles.avgsize=128000000;

<
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

pub.ryan

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值