问题背景:
昨晚电脑断电,今早重新启动各个虚拟机后。CDH的web页面无法正常打开。
问题排查:
1、查看server服务状态:
[root@node01 ~]# systemctl status cloudera-scm-server;
①-显示server启动失败,查看server服务日志。发现是数据库连接出了问题。百度了下,问题可能是因为mysql数据库未正常启动造成的。
2、查看mysql服务的状态:
systemctl status mysql.service ,果然Mysql未正常启动。
①、切换到/var/run/mysqld文件夹,发现果然是mysqld文件夹被删,导致mysql启动无法创建mysqld.pid文件。
3、重新启动mysql服务:
①、手动新建/var/run/mysqld文件夹,并赋予mysql组权限。
mkdir /var/run/mysqld
chown mysql.mysql /var/run/mysqld
②、重新启动mysql服务,并查看状态:
systemctl restart mysql
systemctl status mysql.service
4、重新启动CDH的server服务,并重启各个子节点的agent服务,并查看状态。
systemctl restart cloudera-scm-server;
systemctl restart cloudera-scm-agent;
systemctl status cloudera-scm-server;
systemctl status cloudera-scm-agent;
5、重新访问CDH页面:
成功登录!
备注:Linux上mysql未正常关闭时,/var/run/mysqld 文件夹会被自动删除,导致mysqld.pid进程文件无法被创建,所以mysql服务无法正常启动。后续解决下这个问题。