Hadoop添加和删除节点

最新推荐文章于 2024-10-20 20:19:45 发布

离线之间

最新推荐文章于 2024-10-20 20:19:45 发布

阅读量181

点赞数

分类专栏： hadoop hdfs 文章标签： hadoop hadoop集群 namenode

本文链接：https://blog.csdn.net/wangzheng0408/article/details/52398237

版权

4 篇文章 0 订阅

订阅专栏

2 篇文章 0 订阅

订阅专栏

和普通的datanode一样。添加namenode的ip

添加新增节点的ip或host

./bin/hadoop-daemon.sh start datanode
./bin/hadoop-daemon.sh start tasktracker

1）如果不balance，那么cluster会把新的数据都存放在新的node上
2）设置平衡阈值，默认是10%，值越低各节点越平衡，但消耗时间也更长

 ./bin/start-balancer.sh -threshold 5

注意：
1. 必须确保slave的firewall已关闭;
2. 确保新的slave的ip已经添加到master及其他slaves的/etc/hosts中，反之也要将master及其他slave的ip添加到新的slave的/etc/hosts中

修改conf/hdfs-site.xml文件

<property>  
　　<name>dfs.hosts.exclude</name>  
　　<value>/data/soft/hadoop/conf/excludes</value>  
</property>

dfs.hosts.exclude定义的文件内容为,每个需要下线的机器，一行一个。这个将阻止他们去连接Namenode。如：

slave-003
slave-004

 ./bin/hadoop dfsadmin  -refreshNodes

它会在后台进行Block块的移动

等待刚刚的操作结束后，需要下架的机器就可以安全的关闭了。

./bin/ hadoop dfsadmin -report

可以查看到现在集群上连接的节点

正在执行Decommission，会显示：
Decommission Status : Decommission in progress

执行完毕后，会显示：
Decommission Status : Decommissioned

一旦完成了机器下架，它们就可以从excludes文件移除了
登录要下架的机器，会发现DataNode进程没有了，但是TaskTracker依然存在，需要手工处理一下

关注

专栏目录