CM记录-CDH故障修复处理记录

CDH大数据集群修复记录

1)cm web打不开,查看监听7180端口产生了很多进程,于是kill进程;重启cloudera-cmf-server服务,几秒钟就挂了,查看cloudera-scm-server运行日志是由于mysql服务挂了。

2)查看mysql错误日志,mysql是默认安装在/根分区下的,由于根分区空间不足,无法启动mysql;清理了一些垃圾,重启mysql成功了;重启cloudera-cmf-server成功,但是各个组件出现了很多配置问题;于是重启所有组件,不能重启,究其原因,因与主节点失去联系太久,日志报很多错误;于是重启主机下各个组件,也不能重启,现在各个组件都无法启动;但是进程还在,过了一天后,各个进程死掉了。

遇到问题:a.系统分区空间不足,删掉垃圾文件

          b.默认的/var/log日志文件空间不足,更改路径

          c.无法检测各个主机JAVA_HOME,配置JAVA主目录

          d.权限问题:日志文件夹drwxrwxrwx依次代表u,g,o,组别和拥有者

          e.版本不匹配的问题:cm-guid删掉,重启所有agent

          f.生成的/opt/lib/下的数据文件可以删除

          g.关闭防火墙、关闭SELINUX安全控制

3)重启cloudera-scm-server:/opt/cm-5.10.0/etc/init.d/cloudera-scm-server restart

4)查看日志分析和网上百度,修复各个主机配置、终于发现原来是代理agent id不一样的问题:

   删除各个主机下:rm /opt/cm-5.10.0/lib/cloudera-scm-agent/cm-guid

   重启各个主机下:/opt/cm-5.10.0/etc/init.d/cloudera-scm-agent restart

5)重启cloudera manager service服务

6)重启各个组件(hdfs/hbase/hive/yarn等)服务

7)注意各个组件的log日志文件路径和lib生成的文件以及所需要的JDK根目录是否配置

8)学会使用cm web端查看日志,搜索错误信息

转载于:https://www.cnblogs.com/xinfang520/p/8126392.html

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值