Hive On Spark优化

本文详细介绍了Hive on Spark的优化策略,包括Hive官方建议、集群规划、YARN配置、Container资源设定、Executor参数调整、Join与Group by优化、数据倾斜处理、并行度控制以及小文件优化等方面,旨在提升Hive on Spark的性能和效率。
摘要由CSDN通过智能技术生成

1.Hive官方建议的Hive On Spark优化

 mapreduce.input.fileinputformat.split.maxsize=750000000
 hive.vectorized.execution.enabled=true
 ​
 hive.cbo.enable=true
 hive.optimize.reducededuplication.min.reducer=4
 hive.optimize.reducededuplication=true
 hive.orc.splits.include.file.footer=false
 hive.merge.mapfiles=true
 hive.merge.sparkfiles=false
 hive.merge.smallfiles.avgsize=16000000
 hive.merge.size.per.task=256000000
 hive.merge.orcfile.stripe.level=true
 hive.auto.convert.join=true
 hive.auto.convert.join.noconditionaltask=true
 hive.auto.convert.join.noconditionaltask.size=894435328
 hive.optimize.bucketmapjoin.sortedmerge=false
 hive.map.aggr.hash.percentmemory=0.5
 hive.map.aggr=true
 hive.optimize.sort.dynamic.partition=false
 hive.stats.autogather=true
 hive.stats.fetch.column.stats=true
 hive.vectorized.execution.reduce.enabled=false
 hive.vectorized.groupby.checkinterval=4096
 hive.vec
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值