- 必须先确认集群是在运行中。并且已经退出的安全模式。安全模式状态的查看:
hadoop dfsadmin -safemode leave
- 首先建立一个slaves.exclude文件(此文件名可随机取).它是一个文本, 里面每行就是想要停掉的主机名或IP地址.这里slaves.exclude应放在 /data/hadoop-1.0.2下面
文件内容可如下:
192.168.8.30
这样就表明要把这1台机器给停了. - 在名称节点(master)上,配置conf/mapred-site.xml文件,增加以下配置项:
<property>
<name>dfs.hosts.exclude</name>
<value>slaves.exclude</value>
</property>
<property>
<name>mapred.hosts.exclude</name>
<value>slaves.exclude</value>
</property> - 在master节点上,运行以下命令,更新结点以及hadoop配置:
./bin/hadoop dfsadmin -refreshNodes
- 可以通过 bin/hadoop dfsadmin -report 查看更新信息,内容如下:
Name: 10.12.3.129:50010
Decommission Status : Decommission in progress
Configured Capacity: 3047210987520 (2.77 TB)
DFS Used: 9215509326 (8.58 GB)
Non DFS Used: 162038434994 (150.91 GB)
DFS Remaining: 2875957043200(2.62 TB)
DFS Used%: 0.3%
DFS Remaining%: 94.38%
Last contact: Thu Nov 03 14:55:11 CST 2011
2)可以通过HADOOP WEB(http://masterIP:50070/)查看更新信息www.linuxidc.com;
节点状态有以下同种表示方式:
Normal:正常;
Decommission In Progress:撤消中;
Decommission:已撤消;
6、再次编辑excludes文件 一旦完成了机器下架,它们就可以从excludes文件移除了 登录要下架的机器,会发现DataNode进程没有了,但是TaskTracker依然存在,需要手工处理一下.