问题1
集群由三台阿里云服务器作为三个节点组成,由于一些原因第一台机子出现故障,格式化后重新配置hadoop,另两台机子不变。重新配置免密登录ssh时,报错。
解决:
在slave机子上进入/root/.ssh/known_hosts中,仅保留关于本机的所有内容,删除要连接的master相关内容。
问题2
在master上执行hdfs dfsadmin -report 语句,查看 DataNode 是否正常启动,如果 Live datanodes 不为 0 ,则说明集群启动成功。但是结果显示Live datanodes为0。
解决
排查防火墙是否已经关闭,如果是阿里云服务器,还需要在安全组开放相关端口。
详情参考: