【学习笔记】Hadoop之HDFS架构、SecondaryNameNode、副本放置策略

最新推荐文章于 2022-03-17 19:22:05 发布

潇山远

最新推荐文章于 2022-03-17 19:22:05 发布

阅读量223

点赞数

分类专栏：【学习笔记】【Hadoop】文章标签： Hadoop HDFS架构 SecondaryNameNode SNN 副本

本文链接：https://blog.csdn.net/eryehong/article/details/95165411

版权

5 篇文章 0 订阅

订阅专栏

5 篇文章 0 订阅

订阅专栏

1. HDFS架构

HDFS是主从架构，一个NameNode作为主节点，维护管理文件系统的元数据信息，N个DataNode作为从节点，存储实际的数据块。
【图片后续补】

维护管理文件系统的元数据信息

文件目录结构
文件名称
文件属性（权限，创建时间，副本数…）
文件对应的块（副本）与DataNode的映射关系
这个映射关系，不会持久化存储，而是在集群启动和运行时，由DataNode定期发送BlockReport给NameNode，NameNode在内存中动态维护该映射关系

DataNode可以分布在不同的机架（RACK）上，主要功能存储实际的数据块，提供数据块的读写功能。
另外DataNode还会定时的跟NameNode通信

SecondaryNameNode是NameNode的一个辅助进程，会定期的合并NameNode的fsimage文件和edits日志为新的fsimage文件并推送给NameNode，简称为检查点（checkpoint）
chekpoint默认参数

【图片后续补】

NameNode启动时加载最新的fsimage_n和edits_n+1-n+a，并生成新的日志edits_inprogress_n+a+1
SecondaryNameNode把fsimage_n和edits_n+1-n+a复制到SecondaryNameNode节点，把这两个文件合并为fsimage_n+a
SecondaryNameNode把新的镜像文件fsimage_n+a推送至NameNode
NameNode节点的edits_inprogress_n+a+1写满，名称变更为edits_n+a+1-n+b
NameNode生成新的日志edits_inprogress_n+b+1
SecondaryNameNode定期去NameNode复制最新的fsimage文件和edits日志，并合并为新的fsimage镜像文件