HDFS的启动流程和HA

大大大大肉包

已于 2022-09-10 22:32:17 修改

阅读量1.2k

点赞数 1

分类专栏： HDFS学习文章标签： hdfs hadoop 大数据

于 2022-09-10 22:04:58 首次发布

本文链接：https://blog.csdn.net/qq_42456324/article/details/126799965

版权

3 篇文章 0 订阅

订阅专栏

HDFS的启动流程

当 NameNode 启动时HDFS首先将Fsimage读入内存对元数据进行恢复，然后再读edits文件中的更新操作在恢复后的元数据上进行执行，使得此时的NameNode中保存的是停止前的最新状态，然后删除旧的edits (这个过程称为检査点)，最后等待各个DataNode向 NameNode 汇报文件块的信息来组装 block ID 映射关系。
DataNode 启动时会扫描本地文件系统，产生一个本地文件对应的 HDFS 文件块的列表(每个文件块会对应一个本地文件)，然后作为报告发送到 NameNode(这个报告称为块状态报告)。
NameNode 在接收到每个 DataNode 的块汇报信息后，将其和所在的 DataNode 信息等保存在内存中。

如果 NameNode失效，可以通过 SecondaryNameNode 中保存的 FSImage 和 edits 数据恢复出 NameNode 最近的状态。

为了加快 NameNode 重启速度，SecondaryNameNode 还会定期合并 edits。

在这里插入图片描述

任何时刻，只有一个 NameNode处于 Active状态，另一个处于 Standby 状态。Active NameNode 负责所有的客户端操作，而 Standby NameNode 只是简单的充当 Slave，它负责维护状态信息以便在需要时能快速切换。

主备切换控制器 ZKFailoverController

ZKFailoverController 作为独立的进程运行，对 NameNode的主备切换进行总体控制。
ZKFailoverController 能及时检测到NameNode的健康状况，在主 NameNode故障时借助 Zookeeper实现自动的主备选举和切换，当然 NameNode目前也支持不依赖于 Zookeeper的手动主备切换。

Zookeeper 集群的目的是为主备切换控制器提供主备选举支持。