分布式文件系统HDFS简介

最新推荐文章于 2024-09-13 09:37:52 发布

二琳爱吃肉

最新推荐文章于 2024-09-13 09:37:52 发布

阅读量1.4k

点赞数

分类专栏：大数据文章标签： hdfs hadoop big data

本文链接：https://blog.csdn.net/weixin_45906196/article/details/120892345

版权

13 篇文章 9 订阅

订阅专栏

计算机集群结构

分布式文件系统在物理结构上是由计算机集群中的多个节点构成的，这些节点分为两类，一类叫“主节点”(Master Node)或者也被称为“名称结点”(NameNode)，另一类叫“从节点”（Slave Node）或者也被称为“数据节点”(DataNode)

HDFS主要组件的功能
NameNode	DataNode
存储元数据	存储文件内容
元数据保存在内存中	文件内容保存在磁盘中
保存文件、block、datanode之间的映射关系	维护了block id 到datanode本地文件的映射关系

名称结点负责管理分布式文件系统的命名空间（Namespace），保存了两个核心的数据结构，即FsImage和EditLog，名称节点记录了每个文件中各个块所在的数据节点的位置信息

名称结点的数据结构

FsImage文件包含文件系统中所有目录和文件inode的序列化形式。每个inode是一个文件或目录的元数据的内部表示，并包含此类信息：文件的复制等级、修改和访问时间、访问权限、块大小以及组成文件的块。对于目录，则存储修改时间、权限和配额元数据
FsImage文件没有记录每个块存储在哪个数据节点。而是由名称节点把这些映射信息保留在内存中，当数据节点加入HDFS集群时，数据节点会把自己所包含的块列表告知给名称节点，此后会定期执行这种告知操作，以确保名称节点的块映射是最新的。