设计之初就是为了解决单节点故障问题
HA(High Availability高可用性)这里指的是hadoop的高可用机制
在HDFS中NameNode只有一个,当这个NameNode挂了,整个集群就不能对外服务,需要花很长时间才能修复正常,才能继续工作,生产中是不允许这种事请发生.
单节点故障问题:是指系统中一点失效,就会让整个系统无法运作的部件,换句话说,单节点故障就是整个集群故障.
它将最初的NN(主节点)的log日志进行了分布式存储,是文件存储更加安全;
并且对NN进行了监控,一旦NN出现故障就会立刻更换新的NN,对原有的NN进行替换,防止单节点故障的发生;
它装了两个NN,并且两个NN之间有隔离机制 (不能同时运行两台NN机器),若同时出现两台NN运行的情况,它会强制将先运行的那一台进行kill -9