hadoop调优

  • dfs.replication
    数据块的副本数,默认值为3

  • dfs.block.size
    hdfs数据块大小,默认128M,数据量大的话,可以配置高一些

  • dfs.datanode.balance.bandwidthPeRegionServerec
    HDFS 做均衡时使用的最大带宽,默认为 1048576,即 1MB/s,对大多数千兆甚至万兆带宽的集群来说过小。不过该值可以在启动 balancer 脚本时再设置,可以不修改集群层面默认值。 目前目前我们产线环境设置的是50M/s~100M/s

  • dfs.datanode.failed.volumes.tolerated
    DN多少块损坏后停止服务,默认为0,磁盘故障是常态,可以设置为1或2,避免频繁有DN下线

  • dfs.datanode.max.xcieveRegionServer
    datanode可以同时处理的数据传输连接数,指定在 datanode 内外传输数据使用的最大线程数。
    默认4096,推荐值8192

  • dfs.namenode.handler.count
    namenode中用于处理RPC调用的线程数。默认为10,建议值:参数的自然对数*20
    python -c ‘import math ; print int(math.log(N) * 20)’

  • dfs.namenode.service.handler.count
    用于处理 datanode 上报数据块和心跳的线程数量,与dfs.namenode.handler.count 算法一致

  • datanode 处理 RPC 调用的线程数
    dfs.datanode.handler.count
    datanode中用于RPC调用的线程数,默认为3。可适当增加这个值提升datanode RPC服务的并发度,
    线程数的提高将增加datanode内存需求,不宜过度调整这个数值。产线设置的为10

  • dfs.datanode.max.xcieveRegionServer
    最大传输线程数,指定在datanode内外传输数据使用的最大线程数

  • 读写数据时的缓存大小
    io.file.buffer.size
    设定在读写数据时的缓存大小,应该为硬件分页大小的2倍

  • dfs.replication
    数据块的副本数,默认值为3

  • dfs.block.size
    hdfs数据块大小,默认128M,数据量大的话,可以配置高一些

  • dfs.datanode.balance.bandwidthPeRegionServerec
    HDFS 做均衡时使用的最大带宽,默认为 1048576,即 1MB/s,对大多数千兆甚至万兆带宽的集群来说过小。不过该值可以在启动 balancer 脚本时再设置,可以不修改集群层面默认值。 目前目前我们产线环境设置的是50M/s~100M/s

  • dfs.datanode.failed.volumes.tolerated
    DN多少块损坏后停止服务,默认为0,磁盘故障是常态,可以设置为1或2,避免频繁有DN下线

  • dfs.datanode.max.xcieveRegionServer
    datanode可以同时处理的数据传输连接数,指定在 datanode 内外传输数据使用的最大线程数。
    默认4096,推荐值8192

  • dfs.namenode.handler.count
    namenode中用于处理RPC调用的线程数。默认为10,建议值:参数的自然对数*20
    python -c ‘import math ; print int(math.log(N) * 20)’

  • dfs.namenode.service.handler.count
    用于处理 datanode 上报数据块和心跳的线程数量,与dfs.namenode.handler.count 算法一致

  • datanode 处理 RPC 调用的线程数
    dfs.datanode.handler.count
    datanode中用于RPC调用的线程数,默认为3。可适当增加这个值提升datanode RPC服务的并发度,
    线程数的提高将增加datanode内存需求,不宜过度调整这个数值。产线设置的为10

  • dfs.datanode.max.xcieveRegionServer
    最大传输线程数,指定在datanode内外传输数据使用的最大线程数

  • 读写数据时的缓存大小
    io.file.buffer.size
    设定在读写数据时的缓存大小,应该为硬件分页大小的2倍

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值