hadoop Balance 优化

最新推荐文章于 2025-04-16 12:50:44 发布

小胖头鱼

最新推荐文章于 2025-04-16 12:50:44 发布

阅读量3.7k

点赞数

分类专栏： hadoop 文章标签： hadoop

本文链接：https://blog.csdn.net/chilianyi/article/details/50946818

版权

hadoop 专栏收录该内容

10 篇文章

订阅专栏

优化拷贝带宽（带宽的设置是影响datanode，设置单个datanode的balance带宽上限）：

[-setBalancerBandwidth <bandwidth in bytes per second>]
[@rm.tv.hadoop.sohuno.com ~]$ hdfs dfsadmin -setBalancerBandwidth 50000000
Balancer bandwidth is set to 50000000 for nn.tv.hadoop.sohuno.com/10.10.34.89:8020
Balancer bandwidth is set to 50000000 for rm.tv.hadoop.sohuno.com/10.10.34.90:8020

优化chooseNodes函数中选择source和dest的规则
若有机器磁盘使用率很高，则只拷贝over的。
若有新加入的机器，则只向under拷贝。

可以加大MAX_SIZE_TO_MOVE，使每次迭代中datanode拷贝更多的数据。默认是10GB

final private static long MAX_SIZE_TO_MOVE = 10*1024*1024*1024L; //10GB

加大每台datanode的并行拷贝数：
在balancer启动机器hdfs-site.xml中修改配置：dfs.datanode.balance.max.concurrent.moves 默认为5。同时需要修改source机器的该属性，否则会报异常，并且不生效。

由于4的限制，会导致balancer线程在datanode并行拷贝达到上限的时候无法继续运行，

方案一：在shouldFetchMoreBlocks()判断失败的时候不退出（将else全部注释掉）。

方案二：将MAX_NO_PENDING_MOVE_ITERATIONS 值改大，确保有足够的等待时间等那5个move完成。（默认值是5）

if (shouldFetchMoreBlocks()) {
  // fetch new blocks
  try {
    blocksToReceive -= getBlockList();
    continue;
  } catch (IOException e) {
    LOG.warn("Exception while getting block list", e);
    return;
  }
} else {
  // source node cannot find a pendingBlockToMove, iteration +1
  noPendingBlockIteration++;
  // in case no blocks can be moved for source node's task,
  // jump out of while-loop after 5 iterations.
  if (noPendingBlockIteration >= MAX_NO_PENDING_BLOCK_ITERATIONS) {
    setScheduledSize(0);
  }
}