HDFS主要负责文件存储,包含三种角色:1. namenode 2. datanode 3. secondary namenode
1. namenode
(1)将所有的文件和文件目录信息保存在一颗文件目录树中。
(2)这些信息也会持久化到磁盘里,保存为images系统镜像文件和edit日志文件。
(3)保存每个文件都分成了哪些数据块,分别存储在哪些节点上。但是这些信息不会持久化,在系统启动时,可以由数据节点提取出来。
2. datanode
(1)存储数据的地方,对于全分布式,默认的数据冗余度是3。
(2)接收client端和name发出的读写请求。
(3)定时向namenode汇报数据块中的数据信息。
3. secondary namenode
(1)负责images文件和edit文件的合并,防止edit文件过大。
(2)备份images文件,用来在namenode失效后的恢复。