hive on mr参数配置

本文介绍了在Hive中使用MapReduce执行引擎时的关键参数配置,包括设置作业提交队列、内存分配、文件切分、小文件合并、数据倾斜处理、动态分区及并行执行等,旨在优化Hive查询性能和效率。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

MR参数:

set mapreduce.job.queuename=queue_name;    #设置作业提交队列

set hive.execution.engine=mr;                              #设置计算引擎

set mapreduce.map.memory.mb=4096;               #设置map内存

set mapreduce.map.java.opts=-Xmx3276;           #设置map jvm内存(小于map内存)

set mapreduce.reduce.memory.mb=4096;           #设置reduce内存

set mapreduce.reduce.java.opts=-Xmx3072;       #设置reduce jvm内存(小于reduce内存)


#文件切分
set dfs.block.size = 256000000;                            #设置每个block的大小,控制map数


#合并小文件

#Map输入合并小文件
set hive.input.format=org.apache.hadoop.hive.ql.io.CombineHiveInputFormat;   #执行Map前进行小文件合并
set mapred.max.split.size=256000000;                                              #每个Map最大输入大小
set mapred.min.split.size.per.node=100000000;                                #一个节点上split的至少的大小 
set mapred.min.split.size.per.rack=100000000;   

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值