HDFS：架构设计

最新推荐文章于 2023-03-02 21:46:43 发布

家道消乏

最新推荐文章于 2023-03-02 21:46:43 发布

阅读量217

点赞数

分类专栏： Hadoop基础文章标签： hadoop hdfs 大数据

本文链接：https://blog.csdn.net/lian582796149/article/details/118274249

版权

18 篇文章 0 订阅

订阅专栏

写的不到位的地方，欢迎评论指出不足之处

1、HDFS是一个 主从 （ Master / Slaves ）架构

2、由一个 NameNode 和一些 DataNode 组成

NameNode	完全基于内存存储文件元数据、目录结构、文件 block 的映射需要持久化方案保证数据可靠性提供副本放置策略
注	一个集群由许多台组成，但一个集群只有一个“主” 阿里官方推荐一个集群最大不超过5000台，否则将导致性能下降，管理崩溃的现象
DataNode	基于本地磁盘存储 block (文件的形式) 并保存 block 的校验和数据，保证 block 的可靠性与 NameNode 保持心跳，汇报 block 列表状态
注	同时保存两个文件 1、block 文件 2、校验文件

3、面向文件包含：文件数据（data）和文件元数据（metadata）

4、NameNode 负责存储和管理文件元数据，并维护了一个层次型的文件目录树

5、DataNode 负责存储文件数据（block块），并提供 block 的读写

6、DataNode 与 NameNode 维持心跳,并汇报自己持有的 block 信息

7、Client 和 NameNode 交互文件元数据和 DataNode 交互文件 block 数据

HDFS 结构图

Block备份

家道消乏

关注