hadoop 性能调优 重要参数设置技巧

本文主要探讨MapReduce的性能调优,涉及HDFS和MapReduce的重要参数,如dfs.block.size、io.sort.mb等。通过调整这些参数,可以显著提高集群性能。例如,增加dfs.block.size可以提升网络环境下的性能,但也会增加磁盘开销。mapred.map.tasks和mapred.reduce.tasks是决定MapReduce任务执行效率的关键,需根据集群规模适当设置。此外,参数如mapred.tasktracker.map.tasks.maximum和mapred.tasktracker.reduce.tasks.maximum应与map和reduce任务数量相匹配,以避免资源争抢。同时,合理设置io.sort.mb和mapred.child.java.opts可以优化内存使用,避免过多硬盘操作。最后,磁盘目录配置mapred.local.dir、网络参数如mapred.reduce.parallel.copies和mapreduce.reduce.shuffle.maxfetchfailures也会影响性能,需根据实际网络状况进行调整。
摘要由CSDN通过智能技术生成

这里主要针对Mapreduce的性能调优。

这一两个月在做mapreduce的性能调优,有些心得,还是要记下来的,以郷后人~

这里主要涉及的参数包括:

HDFS:

dfs.block.size

Mapredure:

io.sort.mb

io.sort.spill.percent

mapred.local.dir

mapred.map.tasks & mapred.tasktracker.map.tasks.maximum

mapred.reduce.tasks & mapred.tasktracker.reduce.tasks.maximum

mapred.reduce.max.attempts

mapred.reduce.parallel.copies

mapreduce.reduce.shuffle.maxfetchfailures

mapred.child.java.opts
<

  • 4
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值