今天启动hadoop之后发现主节点的namenode是standby,想切换为active。于是kill -9 掉另外节点的NameNode再重启,发现在未启动该节点的namenode时,主节点namenode状态未改变,仍然是standby状态。将副节点启动之后该节点的NameNode还是active。查资料看日志发现在zkfc的日志下面显示主节点的NameNode是
SERVICE UNHEALTHY,
SERVICE NOT RESPONDING
同时是显示no resource to available
刚开始不知道啥意思,继续查找之后发现有可能是主节点的服务器磁盘空间不足
于是用
df -h
查看磁盘使用情况发现使用了100%
于是看哪些目录使用情况最多
du -sh /* |sort -nr
命令查看目录情况
然后用 du -sh *
一个目录一个目录的看
将能删除的删掉
最后从zookeeper开始全部重启,发现正常了
特此记录