MapReduce2的作业调优

MapReduce2的作业调优检查表:

范围最佳实践更多参考信息
mapper的数量mapper需要运行多长时间?如果平均只运行几秒钟,则可以看是否能用更少mapper运行更长的时间,通常是一分钟左右。时间长度取决于使用的输入格式MapReduce的输入分片与记录
reducer的数量检查使用的reducer数目是不是超过1个。根据经验,Reduce任务应运行5分钟左右,且能生产出至少一个数据块的数据
combiner作业能否充分利用combiner来减少通过shuffle传输的数据量MapReduce中的combiner函数
中间值的压缩对map输出进行压缩几乎总能使作业执行得更快在MapReduce中使用压缩
自定义序列如果使用自定义的Writable对象或自定义的comparator,则必须确保已实现RawComparator
调整shuffleMapReduce的shuffle过程可以对一些内存管理的参数进行调整,以弥补性能的不足MapReduce中的shuffle和排序

完毕。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值