【HDFS】NameNode和SecondaryNameNode工作机制分析

最新推荐文章于 2022-06-09 23:04:06 发布

Kafka_Hive_Flink

最新推荐文章于 2022-06-09 23:04:06 发布

阅读量151

点赞数

文章标签：大数据 hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43771096/article/details/105510263

版权

NN和2NN工作机制

思考：NameNode中的元数据是存储在哪里的？

首先，我们做个假设，如果存储在NameNode节点的磁盘中，因为经常需要进行随机访问，还有响应客户请求，必然是效率过低。因此，元数据需要存放在内存中。但如果只存在内存中，一旦断电，元数据丢失，整个集群就无法工作了。因此产生在磁盘中备份元数据的FsImage。

这样又会带来新的问题，当在内存中的元数据更新时，如果同时更新FsImage，就会导致效率过低，但如果不更新，就会发生一致性问题，一旦NameNode节点断电，就会产生数据丢失。因此，引入Edits日志文件来记录操作(只进行追加操作，效率很高，如果内存出问题就把没来得及存入FsImage中的部分操作重新按照日志文件操作一遍)。每当元数据有更新或者添加元数据时，修改内存中的元数据并追加到Edits中。这样，一旦NameNode节点断电，可以通过FsImage和Edits的合并，合成元数据。

但是，如果长时间添加数据到Edits中，会导致该文件数据过大，效率降低，而且一旦断电，很多操作要重新做一遍，这样恢复元数据需要的时间过长。因此，需要定期进行FsImage和Edits的合并，如果这个操作由NameNode节点完成，因为它本来就很忙，很多东西都要它来管，这样的话又会效率过低。因此，引入一个新的节点SecondaryNamenode当秘书，专门用于FsImage和Edits的合并，就拿来按照Edits恢复操作，恢复FsImage

NN和2NN工作机制，如图所示。

. 第一阶段：NameNode启动

（1）第一次启动NameNode格式化后，创建Fsimage和Edits文件。如果不是第一次启动，直接加载编辑日志和镜像文件到内存。

（2）客户端对元数据进行增删改的请求。

（3）NameNode记录操作日志，更新滚动日志。

（4）NameNode在内存中对元数据进行增删改。

. 第二阶段：Secondary NameNode工作

（1）Secondary NameNode询问NameNode是否需要CheckPoint即合并Edits和FsImage。直接带回NameNode是否检查结果。定时时间为1h或者一百万次操作

（2）Secondary NameNode请求执行CheckPoint。

（3）NameNode滚动正在写的Edits日志。

（4）将滚动前的编辑日志和镜像文件拷贝到Secondary NameNode。

（5）Secondary NameNode加载编辑日志和镜像文件到内存，并合并。

（6）生成新的镜像文件fsimage.chkpoint。

（7）拷贝fsimage.chkpoint到NameNode。

（8）NameNode将fsimage.chkpoint重新命名成fsimage。

（9）最后一波新编辑日志和fsimage.chkpoint合并工作才由NN来进行，合并成元数据最新的FsImage

Kafka_Hive_Flink

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Kafka_Hive_Flink CSDN认证博客专家 CSDN认证企业博客

码龄6年

70: 原创

5万+: 周排名

137万+: 总排名

12万+: 访问

: 等级

2289: 积分

41: 粉丝

97: 获赞

48: 评论

307: 收藏

私信

关注

热门文章

分类专栏

最新评论

【Presto】问题记录：Presto无法查询经过（LZO）压缩的表
Forestswolf: 请教个问题，presto查询压缩表，消耗的内存是不是比不压缩的表更小呢
【Linux】问题记录：sudo设了nopasswd，但是不起作用
没耳朵的Rabbit: 真的很有帮助哦！我在进行Ansible实战的时候，创建了两台虚拟机，一台作为控制节点，另一台作为被控制节点。当我通过在"sudoer"文件中添加"dqx ALL=(ALL) NOPASSWD:ALL"，将作为被控制节点的主机设置为当前用户sudo免密码执行root命令之后，再次通过sudo执行root操作时，它仍然提醒我输入当前用户的密码。在作为控制节点的主机上的Ansible配置文件"ansible.cfg"中设置权限提升为"true"，且不需要提示输入密码之后，通过Ansible管理作为被管理节点的主机时，提示"missing sudo password"信息。而当我按照你的做法，在作为被管理节点的主机中的"sudoers"文件中，添加%dqx ALL=(ALL) NOPASSWD:ALL"之后，两个问题都解决啦！谢谢你！
【Java】子类能获取父类中private权限的属性和方法
皛筱� 爱: 写的可以，建议代码改一下，这个代码不是很浅显易懂，用生活中明显的继承关系的物品更好理解一些
【Java】说HashMap链表长度超过8就会转换成红黑树的出来挨打！
qq_52919000: 严谨, hashcode经过计算之后还要右移16经过异或运算, 楼主疏忽了
【Java】说HashMap链表长度超过8就会转换成红黑树的出来挨打！
杀疯了杀疯了: 哈哈哈很久之前看源码得到的结论，我现在也忘了，但是这种概率确实是存在的。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。