
上图是 HDFS 的架构图,从图中你可以看到 HDFS 的关键组成 namenode datanode
DataNode 负责文件数据的存储和读写操作,HDFS 将文件数据分割成若干数据块。每个 DataNode 存储一部分数据块,这样文件就分布存储在整个 HDFS 服务器集群中。客户端可以对这些数据块进行并行访问,大大提高了访问速度。
HDFS 集群的 DataNode 服务器会有很多台,一般在几百台到几千台这样的规模,每台服务器配有数块磁盘,整个集群的存储容量大概在几 PB 到数百 PB。
NameNode 负责整个分布式文件系统的元数据(MetaData)管理,也就是文件路径名、数据块的 ID 以及存储位置等信息,有点类似数据标签。
本文介绍了 HDFS 的架构,其关键组成包括 NameNode 和 DataNode。DataNode 负责文件数据存储与读写,将文件分割成数据块分布存储,支持客户端并行访问以提高速度。NameNode 负责管理元数据。HDFS 集群 DataNode 数量多,存储容量大。

被折叠的 条评论
为什么被折叠?



