HDFS介绍
HDFS核心由namenode和datanode构成,namenode负责集群元数据管理,datanode负责数据存储。如下官网盗图:
namenode HA架构(基于Quorum Journal Manager)
- namenode除了写fsimage,还会刷editlog。基于JournalNodes的守护进程同步editlog.并在故障发生时从editlog中恢复。同时为了避免脑裂,还可以设置隔离机制,用于阻止inactice namenode继续工作。
- 对于自动failover,HDFS提供了zkfailover,通过在zookeeper监控选举leader.