Hadoop之NameNode的工作机制

小小花生酱

于 2020-06-11 21:31:23 发布

阅读量374

点赞数

分类专栏： hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/HB15458755/article/details/106697436

版权

hadoop 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

可以用下面的图来表示
在这里插入图片描述
1、首先，认识几个名词
　　　　（1）、NameNode中读、写、以及DataNode映射等信息叫做“元数据” ，NameNode元数据存放位置有、内存、fsimage、edits log三个位置。

（2）、edits log：记录当前最新的元数据。

（3）、元数据内存:实际在用的元数据。

（4）、fsimage：元数据内存实体文件，fsimage与NameNode内容是是一样的（最全元数据）

当edits log文件大小达到阈值，会将edits log元数据写入到fsimage文件，并清除edits log中的元数据。

2、NameNode管理元数据方式

（1）、客户端上传文件时NameNode首先会向edits log文件中记录元数据信息。

（2）、客户端上传文件，完成后返回成功信息到NameNode,NameNode将本次上传操作产生新的元数据信息写入到内存中。

（3）、每当editslog文件写满时，SecondeNameNode会将editslog中的元数据同步合并到fsimage中，且清空editslog

（4）、同步数据（checkpiont）触发方式：fs.checkpoint.period 指定两次checkpoit的最大时间间隔，默认为3600秒

：fs.checkpoint.size 　规定ediits文件最大值，一旦超过这个值则强制checkpoint，不管是否到最大时间间隔，默认为64M

3、SecondeNameNode对editslog、fsimage文件同步合并方式

（1）、当editslog文件写满时，NameNode向SecondeNameNode发出请求，通知SecondeNameNode进行文件editslog与fsimage合并。

（2）、SecondeNameNode做出响应，并通知NameNode创建新文件edits.new，且向edits.new文件写入元数据

（3）、SecondeNameNode下载editslog、fsimage文件到SecondeNameNode主机

（4）、SecondeNameNode将下载editslog、fsimage文件做同步合并合并文件为：fsimage.chkpoint

（5）、将合并文件fsimage.chepoint上传到NameNode中fsimage同目录

（6）、重命名fsimage.chepoint文件为fsimage

（7）、重命名edits.new为edits

4、nameNode 元数据存储格式

nameNode（FileName、replicas、block-ids、id2host。。。）

名词解释：FileName：文件名称

replicas：副本个数

block-ids：blockid

后面是文件在dataNode位置

列：/home/test.log,3,{blk_1,blk_2},[{blk_1:[h0,h1,h2]},{blk_2:[h0,h1,h2]}]

小小花生酱

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。