打开CDH管理页面可以发现 某台journalNode与Namenode不同步。在重启之后发现问题并没有解决。所以开始查journalNode的数据与正常journalNode区别在哪里
在根据CDH的配置找到错误的journalNode机器的文件之后发现文件夹为空,其他正常都有一个文件夹
这个文件夹中存储的都是edits_*文件,这些文件都是存储的hdfs近期的操作,与fsimage合并就是当前namenode的元数据。而这台坏掉的journalnode没有存储对应的edits文件,所以会报与namenode不同步的问题。
于是我们创建一个对应的文件夹
mkdir nameservice1
重启hdfs。。。。发现还是报错。又仔细看了下,正常节点的文件夹是 hdfs组 hdfs用户。再次更改。重启集群,发现问题解决