2018/03/10
今天遇见了三次这个节点突然就down的状态,但是从日志里面看没有看到问题。
这个现在还能说出问题具体在哪。
这次重启的话是直接在namenode上重启的。
文件数据还在,只不过刚才跑过的应用信息不见了。
后续要看这个down了的话怎么去解决。
下午3点多,又掉了一个节点,datanode服务在,但是nodemanager不在了
也不知道为什么,看日志是什么东西也没有写。
就这些东西,我也不太理解,这就很尴尬。
!!!!到现在都不知道节点为什么就down了。
2018/03/11
通过dmesg
命令查看就知道,这两台机器都是因为内存占用太多,被系统给kill掉了。
估计死掉的太快,连日志里面的信息都没有输出。
下面两个说了一些问题。
http://wenda.chinahadoop.cn/question/148
http://wenda.chinahadoop.cn/question/153
那么要修改的地方就是分配的资源方面的问题了。
2018//03/16
补漏,当时修改完这个资源配置的问题之后,就没有再出现过这种情况了。
但是也引发了一个问题。那就是本身我这边资源的不够,导致我后续没有办法说搭个spark的情况。