今天遇到的两个问题,记录一下,以备后续查阅。
1. 原Ambari集群启动失败了,提示 postgresql 数据库连接不上。想着简单,那就开启数据库吧,单独启动数据库失败。不明所以,试着进一下Mysql数据库,也进不去了。。。。提示 Can 't connect to local MySQL server through socket '/tmp/mysql.sock' ,网上找了解决方法,不外乎重启服务,依然失败。后看到一篇查看硬盘存储情况的,恍然大悟,查看机器硬盘
df -h
显示已经使用100%,后逐层查看
du -sh *
删除掉无用的日志后,启动Ambari正常。
遇到问题先想了软件方面可能的错误,没想到绕了一圈是硬件问题。以后注意硬件的维护,以及遇到问题思考的方向、方法。
2.第二个问题:集群启动正常后,某一个节点收不到心跳。
原因:前几天升级了该节点的python版本,系统中很多软件是依赖于python2.6的。
解决:将系统python改回2.6版本。
使用命令 which python 可查看到python的位置是在 /usr/local/bin/python 下,而python2.6在 /usr/bin/ 目录下,将 /usr/local/bin/python 软连接到 /usr/bin/python2
ln -s /usr/bin/python2 /usr/local/bin/python
查看python版本 : python -V
问题解决