从零搭建生产Hadoop集群（八）——上线与下线数据节点流程

最新推荐文章于 2022-12-28 21:50:18 发布

fish的饭票

最新推荐文章于 2022-12-28 21:50:18 发布

阅读量1k

点赞数

分类专栏： hadoop 文章标签： CDH Hadoop 数据节点上线下线

本文链接：https://blog.csdn.net/lxbalex/article/details/83959704

版权

7 篇文章 2 订阅

订阅专栏

一、概述

Hadoop集群中，经常需要在不重启集群的前提下，动态地上线与下线数据节点，而使用Cloudera Manager管理的集群，可以很方便地做到这一点，本文将介绍其相关流程。

新节点的硬件配置最好能够跟原集群服务器保持一致或相差不大，而且上线之前，需要对硬件与系统层面的配置检查与初始化，可以参考本系列文章从零搭建生产Hadoop集群（三）——CDH集群搭建的第二节——硬件检查与系统配置，如关闭防火墙与Selinux、开启ntpd服务、配置hosts等。

下面根据CM的向导添加主机到集群当中：

至此，新节点均已加入到CM管理当中，不过这里别忘了，为主机分配机架，因为hadoop是有机架感知机制的，对副本的分布有很大影响。可在“主机”页面勾选新节点，选择“分配机架”，填写对应机架即可。

一般新数据节点上会启动datanode与nodemanager进程，也有可能有其他实例，这里以datanode添加过程为例，其他实例也类似：

实例加入HDFS服务之后，若自定义了多个配置组，需要为其制定合适的配置组：

以上步骤完了之后，便可到实例页面，勾选对应的datanode实例，选择启动即可。若启动失败，可点击对应日志检查。

下线节点流程比较简单：

到对应的服务实例页面，勾选对应实例选择“解除授权”，执行后角色实例进程将会停止，再将其勾选删除即可。需要注意的是，datanode下线时需要对数据进行均衡，因此如果节点数据量比较大的话，下线需要一定的时间，而且不要同时下线两台及以上的数据节点，可能会造成数据丢失。
到下线主机上停止CM Agent进程
确认下线主机上的实例进程均已删除和关闭后，在“主机”页面勾选对应主机选择“删除”

下线后的节点，其上的CDH环境如需清理，可参考文章Cloudera Manager及CDH的卸载进行处理。

欢迎关注我的微信公众号

关注