hive 优化与设置

本文详细介绍了Hive的优化技巧,包括调整map与reduce执行比例,设置数据压缩,处理空值与NULL,以及select查询结果的设置。通过设置mapreduce.job.reduce.slowstart.completedmaps参数延迟reduce启动,启用数据压缩提升效率,并提供了解决NULL问题的方法,如使用NVL函数处理空值。
摘要由CSDN通过智能技术生成

 

 

1. 设置map与reduce 执行过程

配置 mapreduce.job.reduce.slowstart.completedmaps 参数

该参数默认为 0.05, 表示map执行 5%之后,开始reduce过程。如果集群资源不够,有可能导致reduce把资源全抢光,可以把这个参数调整到0.8,map完成80%后才开始reduce copy 过程。

可以配置为如下:

set mapreduce.job.reduce.slowstart.completedmaps=0.8;  -- map 执行了 80%后再执行reduce

set mapreduce.job.reduce.slowstart.completedmaps=0.9;

 2.设置数据压缩

配置中间数据压缩属性 hive.exec.compress.intermediate ,该参数默认为false-不压缩。可设置为 true-压缩。

配置输出结果压缩功能 hive.exec.compress.output ÿ

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值