一、背景
一般当遇到停机或停电通知情况时需要执行停止CDH集群和CM集群的操作,以下为集群节点角色列表,本文将详细介绍如何安全启停CDH集群和CM集群。
主机 | 角色 |
---|---|
node1 | namenode,cloudera-scm-server,cloudera-scm-agent |
node2 | datanode,cloudera-scm-agent |
node3 | datanode,cloudera-scm-agent |
二、停止CDH集群和CM集群
停止CDH集群
登录CM管理页面,下拉项中点击停止。
逐项停止CDH集群所有组件,如下所示:
停止CM服务
下拉项中点击停止。
停止node1节点上的Event Server、Host Monitor、Alert Publisher和Service Monitor服务,如下所示:
停止CM Server和Agent进程
node1节点上依次停止cloudera-scm-agent和cloudera-scm-server进程
# 先stop agent
pssh -h ./nodes -i 'systemctl stop cloudera-scm-agent'
# 后stop server
systemctl stop cloudera-scm-server
停机节点(集群每个节点)
# 1分钟后关机
shutdown -h 1
三、启动CDH集群和CM集群
启动节点(集群每个节点)
集群中所有节点先开机。
启动CM Server和Agent进程
一般cloudera-scm-agent和cloudera-scm-server进程都设置了开机自启,系统开机后进程也会启动,在node1节点上执行如下命令查看进程状态:
pssh -h ./nodes -i 'systemctl status cloudera-scm-agent'
systemctl status cloudera-scm-server
启动CM集群和CDH集群
首先,登录CM管理页面,点击启动。
其次,在CDH集群下拉菜单中点击启动。
最后,CDH集群组件服务结果如下表示CDH集群启动成功。