cloudera manager5删除uuid,主机找不到集群

原创 2015年11月18日 16:35:56

cloudera manager给开发人员节省了维护成本,但是一旦cm节点不能启动,将导致集群组件无法管理。
问题描述:
服务器重启后cm节点未能正常启动,在排查问题过程中误删除uuid文件。该文件在cm-5.3.6/lib/cloudera-scm-agent目录下。
解决步骤:

  1. agent无法启动,由于对7180、7182混淆,以为端口配置错误,修改后出现闪退,原因是修改配置文件写错,cm-5.3.6/etc/cloudera-scm-agent/config.ini文件[General],少了右侧] 。修改后agent正常启动。
  2. 在cm管理界面中,无法接受到agent的检测信号。
    这里写图片描述
    出问题时,在原安装的集群中,看不到当前主机,查看所有主机时,发现当前主机作为一个新主机。而不属于当前集群。即当时上图中集群字段为空。
  3. 当前问题就是怎样让主机回到原来的集群。查找cm安装时的数据库,在HOSTS表中,存储了cm管理的所有主机。会看到当前主机被作为新主机添加,生成了不同的uuid。这样问题就好办了。在数据库中拿到原有的uuid放到uuid文件中。重启服务,解决问题。
    这里写图片描述

弯路:
当找不到主机时,第一反应是要重装服务,但是面临的风险是巨大的,hdfs数据可能丢失。

相关文章推荐

clouder manager uuid文件导致无法添加主机问题

初接触CM不久,公司要求部署一个三个节点的测试集群(虚拟机)。 dn01 dn02 dn03 整个集群安装好之后才发现dn03的硬盘分的太小了,导致CM集群一些项以红色警告方式提醒,先尝试重新...

CDH安装时,无法纳管全部的节点的一个bug

问题描述:        使用CDH 5.2版本安装时,agent节点有12个。按照安装说明,在各个节点启动cm-agent之后,发现只有6个节点能被纳管。其它的节点总是无法加入纳管中。 在确认防火...

CDH安装中遇到的问题解决

--------------------------cdh中重装hbase后之前的脚本残留解决--------------------- 1.切换到zookeeper的bin目录;  //zook...

cloudera 卸载

一、卸载CM:(CM主机执行) 1、移除所有服务
     先在Cloudera Manager管理端停止集群所有组件服务,然后删除所有服务。   2、 删除Manager Ser...

cloudera manager迁移主机

公司集群cloudera-scm-server所在的主机发生了故障,一直重启,需要拿去重做系统,但整个cloudera manager集群不想动,服务也不能停止,需要将cloudera-scm-ser...

CDH 5.x 集群安装及卸载

上次写了CDH安装测试总结,由于那个博客篇幅略长, 但是主要集中在第二章,所以单独把CDH安装、卸载这块的内容拉出来在一篇记录一下。一.搭建远程yum源1.启动http服务: service ht...

CDH5实践(三)Cloudera Manager 5卸载步骤

Cloudera Manager 5卸载步骤 转自http://www.jianshu.com/p/d3d5751e7ec5
  • csolo
  • csolo
  • 2016年09月19日 21:52
  • 4278

CDH5.X完全卸载步骤

//CDH5.X完全卸载步骤 # by coco # 2015-01-14 1. 关闭集群中的所有服务。  这个可以通过clouder manger 主页关闭集群。 2. 卸载 [...

卸载 Cloudera CDH 5 beta2总结

问题导读: 1.卸载Cloudera-Manager的命令是什么? 2.cloudera的安装目录有哪些? 3.如何删除 Cloudera Manager的lock file? 操作的系...

CDH中NameNode启动报错一例问题的处理

错误明细: Failed to start namenode. java.io.IOException: There appears to be a gap in the edit log. We...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:cloudera manager5删除uuid,主机找不到集群
举报原因:
原因补充:

(最多只允许输入30个字)