一、问题描述
数据突然写不进去,重启hdfs发现datasophon01节点namenode掉线
grep “ERROR” xxx.log 查看日志报错
1.1 查看datasophon01 节点namenode报错
通过报错发现 JournalNode 有问题
1.2 查看 JournalNode 节点
报错日志
JournalNode 原理
为了保证 Active 节点和 Standby 节点,即可以可靠的保持数据的一致性,又不会影响集群的可用性,HDFS 在 Active 节点和 Standby 节点之间引入了另外一个节点 JournalNode 节点。
JournalNode 节点作为 Active 节点和 Standby 节点的中间节点,它为两个节点解决了数据的同步的问题。首先 Active 节点会将元数据发送给 JournalNode 节点,然后 Standby 节点会从 JournalNode 节点获取需要同步的元数据。即使 Standby 节点故障了、产生问题了,在它恢复正常状态后,也可以从 JournalNode 节点中同步相应的数据。这就要求 JournalNod