[ 一:HDFS结构 ]
Namenode:用于管理文件系统的命名空间、目录结构、元数据信息以及提供备份机制;
DataNode:用于存储每个文件的“数据块”数据,并且会周期性地向NameNode报告该DataNode的数据存放情况;
JournalNode:用于同步主备NameNode之间的元数据信息;
Zookeeper:是一个协调服务,帮助ZKFC执行主NameNode的选举;
ZKFC:它负责监控NameNode的状态,并及时把状态写入Zookeeper;
[ 二:HDFSHA集群 ]1.为了避免单点故障问题,HDFS一般采用HA集群的方式部署,典型的HDFSHA场景为主备两个NameNode方式运行,一个处于Active状态,另一个处于Standby状态,一旦主NameNode出现故障,可以迅速切换至备NameNode,从而不间断对外提供服务。
2.NameNode之间通过一组JournalNode同步元数据信息,实现Active和Standby两个NameNode的元数据信息同步。
[ 三:HDFS原理