问题描述:以yarn为资源管理器的hadoop集群中,启动失败。
具体表现为:执行过start-all.sh之后,集群启动且无报错信息,但是web界面显示的结果与配置文件中的不符合。
解决思路:
- 首先查看主节点的resourceManager相关日志文件,查看报错信息。重点看”caused By”之后的信息。发现地址无法绑定,让我们参考https://wiki.apache.org/hadoop/BindException。
- 依次查看所有从节点的logs目录下的nodemanager相关的日志文件,同上。
地址无法绑定的解决方法:
直接使用 netstat -anp | grep portno
即:netstat –apn | grep 120001
最后一列的数字就是占用该端口号的进程ID,执行kill -9 PID杀死即可。