Hadoop HA架构思想总结
架构图
在这里插入图片描述
![(https://img-blog.csdnimg.cn/f895f3c2d9dd4870827ffad73efd501c.png)
角色介绍
- NN节点,即NameNode节点,负责hadoop文件的元数据规划、存储和接收DN节点关于实际文件数据存储信息的汇报
- DN节点,即数据节点,负责具体文件数据的存储,存储文件块数据,hadoop中,文件是按指定块大小切割后,按块存储在DN节点中
- SNN节点,即SecondaryNameNode节点,在单NN节点部署模式下负责拉取NN节点上的fsimage和editlog,并合并生产新的fsimage,并推送到NN节点
- ZK集群,即Zookeeper集群,起分布式协调作用,这里支持FC完成NN的高可用功能
- ZKFC,即FailoverController进程,借助zk完成NN的高可用功能,包括NN节点的监控,ZK上节点的删除,NN角色转换和重启等
- JN,即JournalNode进程,作为NN集群之间数据同步的中间件,使得NN集群满足最终一致性,在可用性和一致性达到折中
- client,即使用hadoop的用户端程序