在生产环境中,会碰到hadoop集群DataNode/NodeManager的节点下线/上线。如果强制下线节点会影响到线上作业,而且还会影响到hdfs上数据丢失的风险。面对线上节点的上线/下线,hadoop提供了平滑下线/上线的机制。
本集群为一个主节点master,两个从节点slave1,slave2.
1.下线DataNode
1.1 在namenode节点的hdfs-site.xml中增加配置。PATH路径根据自己的实际情况进行配置。
<property>
<name>dfs.hosts.exclude</name>
<value>/usr/local/service/hadoop/etc/hadoop/hdfsexcludedhosts</value>
</property>
1.2 在相关文件中添加需要下线的主机
[root@master ~]# cat /usr/local/service/hadoop/etc/hadoop/hdfsexcludedhosts
slave1
slave2
1.3 在NameNode运行一下命令,将经过审核的DataNode更新至NameNode

本文详细介绍了如何在生产环境中平滑地对Hadoop集群的DataNode和NodeManager节点进行下线和上线操作,以避免影响线上作业和数据丢失。下线过程包括在配置文件中添加节点、更新NameNode或ResourceManager,并检查下线状态。上线步骤则涉及修改配置文件,更新节点状态。在HA高可用集群中,这些操作需要在所有主控节点上执行。
最低0.47元/天 解锁文章
5368

被折叠的 条评论
为什么被折叠?



