MapReduce并发参数控制

maper数量控制

  • 决定参数
    • 配置参数
      • mapreduce.input.fileinputformat.split.minsize //启动map最小的split size大小,默认0
      • mapreduce.input.fileinputformat.split.maxsize //启动map最大的split size大小,默认256M
      • dfs.block.size //block块大小,默认64M
      • mapreduce.job.maps //显示设定的期望的mapper的数量
      • 计算公式:splitSize = Math.max(minSize, Math.min(maxSize, blockSize));
    • 输入文件数目与单个文件大小
      • 不进行显式设定 splitSize 和 mapper 数量参数时,通常一个文件分配给一个独立的mapper
      • 显式设定了参数时
        1. 若只显式设定 splitSize 或 mapper数量 中的一个
          • Hadoop并不会按照设定的参数进行分片大小和mapper数量的设置,而是按照blocksize的大小进行切分和创建mapper
        2. 若同时显式设定了 splitSize 和 mapper 数量
          • 此时会按照设定的 splitSize 大小进行设置分片,而 mapper 的数量并不一定与显式设定的 mapper 数量一致,而是对输入的文件大小和数量按照显式设定的 splitSize 的大小对输入文件切分后所得的 mapper 数量
          • 对输入文件进行切分时
            • 若单个文件大小 < splitSize,则该单个文件将分配给一个独立的mapper
            • 若单个文件大小 &
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值