NameNode和Secondary NN的工作机制，FsImage与Edits的相关说明

最新推荐文章于 2024-09-27 16:14:00 发布

黑心大老板～

最新推荐文章于 2024-09-27 16:14:00 发布

阅读量40

点赞数 1

文章标签：大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_63713536/article/details/134753654

版权

下面来介绍一下hadoop中两个存储数据的组件NameNode和Secondary NameNode，分别简称为NN与2NN。

首先思考一个问题，数据存储在内存和磁盘上优缺点是什么？
优点：在内存上读写速度快，在磁盘上，关机不丢失

缺点：在内存上掉电丢失，可靠性差，在磁盘上，关机也不丢失数据，但是读写数据慢

有没有一种方法即能做到读写速度快又能关机不丢失数据呢？

hadoop的设计者聪明的想出来将存储数据分为两部分，一个是FsImage(元数据镜像文件），一个是Edits（追加操作日志）。

第一次启动NameNode格式化后，创建Fsimage和Edits文件。如果不是第一次启动，直接加载编辑日志和镜像文件到内存。用户进行操作，会先将操作描述写进edits磁盘文件中，然后将新写入的部分加载到内存中，如果是先进行将操作描述写入内存中，这时候掉电的话那么就会丢失数据。系统会根据这个操作也是直接加载到FsImage内存，到合并的时候才去根据这些操作写入fsimage磁盘中。

2NN作用：对FsImage和Edits进行合并。如果Edits文件量过大或者定时对两个文件开始合并操作，先将FsImage和Edits分别拷贝一份，在NN中生成一份新的Edits2文件也就是在合并过程中出现的用户操作写入Edits2文件中，2NN对拷贝的两份FsImage和Edits文件加载到内存中并合并生成新的Fsimage文件，这时候2NN会告诉NN，我合并好了，NN会将这份新的Fsimage文件替换旧的Fsiamge文件。

下面是详细说明：

1）第一阶段：NameNode启动

（1）第一次启动NameNode格式化后，创建Fsimage和Edits文件。如果不是第一次启动，直接加载编辑日志和镜像文件到内存。

（2）客户端对元数据进行增删改的请求。

（3）NameNode记录操作日志，更新滚动日志。

（4）NameNode在内存中对元数据进行增删改。

2）第二阶段：Secondary NameNode工作

（1）Secondary NameNode询问NameNode是否需要CheckPoint。直接带回NameNode是否检查结果。

（2）Secondary NameNode请求执行CheckPoint。

（3）NameNode滚动正在写的Edits日志。

（4）将滚动前的编辑日志和镜像文件拷贝到Secondary NameNode。

（5）Secondary NameNode加载编辑日志和镜像文件到内存，并合并。

（6）生成新的镜像文件fsimage.chkpoint。

（7）拷贝fsimage.chkpoint到NameNode。

（8）NameNode将fsimage.chkpoint重新命名成fsimage。

黑心大老板～

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

黑心大老板～

博客等级

码龄3年

13
原创

45
点赞

34
收藏

206
粉丝

关注

私信

热门文章

最新评论

数仓分层架构
CSDN-Ada助手: 恭喜您在博客领域持续创作，文章“数仓分层架构”内容详实，阐述清晰。建议您在下一篇博客中可以深入研究数仓架构的实际应用案例，或者探讨数仓架构在大数据环境下的挑战与解决方案。希望您继续保持创作热情，为读者带来更多有价值的内容。
Spark作业工作流程
CSDN-Ada助手: 恭喜您撰写了关于“Spark作业工作流程”的精彩博客！不仅内容详实，而且结构清晰，让读者能够轻松理解。希望您能继续坚持创作，分享更多有价值的技术文章。建议您在下一篇博客中可以深入探讨Spark作业的性能优化策略，相信会吸引更多读者的关注。加油！
reduceByKey和groupByKey的区别
CSDN-Ada助手: 恭喜您写了这么有意义的博客！对于reduceByKey和groupByKey的区别，您解释得非常清晰明了。接下来，我建议您可以尝试写一篇关于如何优化Spark程序性能的文章，或者深入探讨一些常用的Spark算子的使用技巧。期待您更多的精彩内容！祝您创作愉快！
HDFS的安全模式
CSDN-Ada助手: 算法技能树或许可以帮到你：https://edu.csdn.net/skill/algorithm?utm_source=AI_act_algorithm
hadoop中HDFS的写流程
CSDN-Ada助手: 恭喜你写了第6篇博客！标题“hadoop中HDFS的写流程”听上去很有意思。我很高兴看到你持续创作，并分享有关Hadoop和HDFS的知识。你对Hadoop的理解和解释非常清晰，但我想知道下一步你是否可以深入探讨一下HDFS的读取流程呢？我相信你一定能够以自己独特的方式呈现出这个主题。期待你的下一篇博客！加油！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。