Hadoop配置调优属性表

map端的调优属性

属性名称类型默认值说明
mapreduce.task.io.sort.mbint100排序map输出时所使用的内存缓冲区大小,单位:M
mapreduce.map.sort.spill.percentfloat0.80map输出内存缓冲和用来开始磁盘溢出写过程的记录边界索引二者的比值
mapreduce.task.io.sort.factorint10排序文件时的一次最多合并的流数
mapreduce.map.combine.minspillsint3运行combiner所需的最少溢出文件数
mapreduce.map.output.compressBooleanfalsemap输出端是否压缩
mapreduce.map.output.compress.codecClassorg.apache.hadoop.io.compress.DefaultCodecmap输出端压缩编码器
mapreduce.shuffle.max.threadsint0集群范围设置每个NM的工作线程数,负责将map输出到reduce。0表示使用Netty默认值,即两倍于可用的处理器数
  • 大体通过给shuffle过程尽量多的提供内存来提高效率。
  • map端避免多次溢出写入磁盘的次数。
  • 任务节点上的内存应该尽量大。
  • 增加Hadoop的默认缓冲区(4KB),通过改变属性:io.file.buffer.size

reduce端的调优属性

属性名称类型默认值说明
mapreduce.reduce.shuffle.parallelcopiesint5map端输出复制到reduce端的线程数
mapreduce.reduce.shuffle.maxfetchfailuresint10在声明失败前,reducer获取一个map输出所花的最大时间
mapreduce.task.io.sort.factorint10排序文件时的一次最多合并的流数
mapreduce.reduce.shuffle.input.buffer.percentfloat0.7在shuffle阶段,分配个map输出缓冲区占堆空间的百分比
mapreduce.reduce.merge.percentfloat0.66map输出缓冲区(mapred.job.shuffle.input.buffer.percent)的阈值使用比例,用于启动合并输出和磁盘溢出写的过程
mapreduce.reduce.merge.in.mem.thresholdint1000启动合并输出和磁盘溢出写的map输出阈值数
mapreduce.reduce.merge.in.put.buffer.percentfloat0.0reduce阶段,内存中map输出的大小不能大于这个数值,以便给reduce提供更多的内存;也可以增加比值,让map端减少磁盘溢出写的次数
  • reduce端增加中间数据放在内存的比例,为reduce函数预留内存。如果reduce函数内存需求不大,改变属性:mapreduce.reduce.merge.inmem.threshold设置为0,把mapreduce.reduce.merge.in.put.buffer.percent设置1.0或更低

推测执行的属性

属性名称类型默认值说明
mapreduce.map.speculativebooleantrue决定如果任务运行慢,是否启动map任务的另外一个实例
mapreduce.reduce.speculativebooleantrue决定如果任务运行慢,是否启动reduce任务的另外一个实例
yarn.app.mapreduce.am.job.speculator.classClassorg.apach.hadoop.map.reduce.v2.app.speculate.DefaultSpeculaorSpeculaor类实现推测执行策略
yarn.app.mapreduce.am.job.estimator.classClassorg.apach.hadoop.map.reduce.v2.app.speculate.LegacyTaskRuntimeEstimatorSpeculaor实例用TaskRuntimeEstimator估计任务运行时间

对于reduce任务,为减少集群上的网络传是,关闭推测执行是有利的。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值