1.Hadoop高可用
有2台机器,2个namenode,一个active,一个standby
有一个守护进程journalnodes,会和2个nn进行通信,当activeNN对命名空间信息修改时,会持久化到editslog上,然后standbyNN观察editslog,并更新自己的信息,保持信息和activeNN同步。
还有一个zookeeper failover controller,通过zookeeper failover controller里面的health monitor监控NN,如果activeNN挂掉了,通过zookeeper选取自动完成主备切换。
2.启动hadoop后有哪些进程
Nn,dn,2nn
Rm,nm
Journal node, zookeeper failover controller