Hadoop解决单点故障问题主要是通过两种方式:
1、NFS文件共享
2、QJM 方式 CLOUDERA提出的
在Hadoop2.x中有两个nn,一个是 active namenode,状态是active。另一个是standy namenode,状态是standy。两者是进行切换的,但是有且只有一个active!
NFS方式是重量级的需要单独部署维护的,他作为active namenode和standy namenode之间数据共享的存储,缺点是如果active namenode 或者standy namenode有一个和NFS之间发生网络故障,将会造成数据同步问题。
QJM方式解决了NFS面临的问题,active namenode和standy namenode 之间通过一组奇数个的journalnode来共享数据,active namenode把最近的edits文件写到2n+1个journalnode中的n+1个中,然后standy namenode 就开始读取,这种方式支持容错!
本文转载自:http://www.linuxidc.com/Linux/2015-05/117693.htm