1.namenode启动不了:使用hadoop-daemon.sh start namenode也没用
查看日志:
(1)第一种可能是配置的文件路径不一致导致出错,删除掉core-site.xml中的tmp.dir配置,统一配置到hdfs-site.xml中。
(2)第二种是因为断电关机等原因系统删除了tmp文件中的name,使得namenode不能启动。
解决办法1:如果secondnamenode安装在了另一台机器,可以使用secondnamenode恢复:
第一步删除 namenode主节点的metadata配置目录:rm -fr /data/dfs/name
第二步从起机器,第三步使用hadoop namenode -importCheckpoint恢复
解决办法2:使用hadoop namenode -format格式化namenode所在的机器
2.Resourcemanager启动报错
starting Resourcemanager, logging to /home/hadoop/soft/hadoop-2.7.3/logs/hadoop-hadoop-Resourcemanager-node2.out
Error: Could not find or load main class Resourcemanager
查看日志信息
Caused by: java.net.BindException: Problem binding to [node2:8031] java.net.BindException: 无法指定被请求的地址; For more details see: http://wiki.apache.org/hadoop/BindException
解决办法:对于完全分布式集群必须要在安装Resourcemanager的机器上启动yarn
侵删!
参考:hadoop集群崩溃,因为tmp下/tmp/hadoop-hadoop/dfs/name文件误删除 - 代码王子 - 博客园
java.net.BindException: Problem binding to [hadoop103:8031] java.net.BindException - 与君共舞 - 博客园