hdfs的balancer功能、hadoop增删节点小试

本文介绍了在Hadoop 2.2.0环境下如何使用hdfs balancer进行数据平衡,以及如何动态调整平衡带宽。在节点删除过程中,详细阐述了修改配置文件、刷新节点状态的步骤,以及节点移除后数据处理的细节。
摘要由CSDN通过智能技术生成

版本:hadoop2.2.0

一 、节点数据平衡

近期发现,试验环境2个datanode节点,往hdfs put数据,无数据备份情况下每次都只往节点1写数据,于是想自己动手平衡一下数据。

操作:

在hadoop sbin目录下的脚本start-balancer.sh,调整平衡的范围

执行脚本 ./start-balance.sh -threshold 5

以上命令的意思是先统计hdfs利用率,比如node1 20%,node2 2%,整个集群利用率为11%,平衡的范围是(11%+x%,11%-x%)这里的参数x是5,因此平衡范围是(16%,6%),节点1超出,节点2不足,节点1的数据块往节点2移动

执行命令后发现数据移动特别慢,移动2GB的数据,花费时间超过1个小时,原因是默认的节点间数据移动速度是1MB/s,可以修改数据平衡带宽,有两种修改方法,方式一:修改hdfs-site.xml文件的配置,增加以下配置:

  <property>
     <name>dfs.balance.bandwidthPerSec</name>
     <value>10485760</value>
  </property>

方式二:动态修改

hdfs dfsadmin -setBalancerBandWidth 10485760

后面的参数的单位是Byte


二、节点删除

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值