公司一个只有两个节点的Hadoop集群,提交作业出现失败:
开发一直找不到原因,于是我决定自己解决一下。
首先查看日志:
查询网上相关信息,看看有没有人遇到过,比较幸运,还真有:
看看别人是怎么回答他的:
这里意思是集节点的用自己的自身的系统时间的时候可以偶尔漂移,随着时间的推移。
“对于任何容器,如果相应的NM并不默认10分钟,该容器已开始的时间配置的时间间隔内运行RM,报告,容器被视为死亡,由RM过期”。
故此分析极有可能就是由此引起的。
查看各个节点系统时间:
发现两个节点的时间还真的都不一样。
更改系统时间:
同步硬件时间到系统时间,免得重启导致时间又变了。
重新执行任务:
任务成功了!