一、分布式系统常见的模式。
- 去中心化模式:各个节点平级,大家协调工作。
- 中心化模式:有明确的中心,基于中心节点分配工作。也叫做主从模式(master-slaves)
hadoop就是中心化模式。(包括其三大组件,因为在部署的时候会启动对应的主节点和从节点)
二、HDFS
2.1 HDFS和Hadoop的关系
- HDFS是hadoop的三大组件之一,是hadoop的分布式文件系统。(hadoop distributed file system)
2.2 HDFS的基础架构
- NameNode:主角色(只有一个)
1.是一个独立的进程。当在服务器上启动了NameNode,那么他就有一个进程。
2.负责管理HDFS的整个文件系统和Datanode。
- DataNode:从角色(有多个)
1.是一个独立的进程。
2.主要负责数据的存储,即存入数据和取出数据。
- SecondaryNameNode:主角色的辅助角色。
1.独立进程
2.帮助NameNode完成元数据的整理工作。(打杂)(元数据是什么后边会介绍到)