HDFS四大机制之负载均衡

Hadoop集群中的负载均衡旨在确保每个DataNode的数据存储占比相近。NameNode会定期检查并自动启动负载均衡,当发现节点负载不均时,会将数据从存储占比大的节点移动到存储占比小的节点。默认带宽为1MB/s,可通过配置`dfs.datanode.balance.bandwidthPerSec`调整。手动启动负载均衡使用`start-balancer.sh -t 10%`,该命令允许的最大最小存储占比差为10%,实际操作时应配合带宽调整。
摘要由CSDN通过智能技术生成

hadoop集群中多个datanode中每一个datanode存储的数据的占比相当,负载均衡和每一个datanode的硬件相关的

对于hadoop集群来说  namenode会定期检查集群的负载  如果发现集群中datanode节点的负载不均衡的情况下  自动启动负载均衡
进行负载均衡---》 将存储占比大的datanode节点上的数据  移动到 存储占比小的datanode节点上
将node1的数据块  移动  node2上   底层网络传输
将node1上的数据经过网络传输  传递给  node2再将node1上的删除
默认情况下这个带宽是很小的
<property>
  <name>dfs.datanode.balance.bandwidthPerSec</name>
  <value>1048576</value>
  <description>
        Specifies the maximum amount of bandwidth that each datanode
        can utilize for the balancing purpose in term of
        the number of bytes per second.
  </description>
</property>
默认带宽  1m/s 
默认的负载均衡如果集群中的节点很少的  默认的负载均衡完全没问题的

如果集群中的节点很多的时候   默认的负载均衡很难达到需求了
手动启动负载
start-balancer.sh -t 10%
注意:
    1)这个命令不会立即执行  类似于jvm垃圾回收 
    提醒集群空闲的时候  立即执行  加快执行效率
    2)-t 10% 代表我们可接受的最高值和最小值的差

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值