Hadoop之NameNode的工作机制

可以用下面的图来表示
在这里插入图片描述
1、首先,认识几个名词
    (1)、NameNode中读、写、以及DataNode映射等信息叫做“元数据” ,NameNode元数据存放位置有、内存、fsimage、edits log三个位置。

(2)、edits log:记录当前最新的元数据。

(3)、元数据内存:实际在用的元数据。

(4)、fsimage:元数据内存实体文件,fsimage与NameNode内容是是一样的(最全元数据)

当edits log文件大小达到阈值,会将edits log元数据写入到fsimage文件,并清除edits log中的元数据。

2、NameNode管理元数据方式

(1)、客户端上传文件时NameNode首先会向edits log文件中记录元数据信息。

(2)、客户端上传文件,完成后返回成功信息到NameNode,NameNode将本次上传操作产生新的元数据信息写入到内存中。

(3)、每当editslog文件写满时,SecondeNameNode会将editslog中的元数据同步合并到fsimage中,且清空editslog

(4)、同步数据(checkpiont)触发方式:fs.checkpoint.period 指定两次checkpoit的最大时间间隔,默认为3600秒

:fs.checkpoint.size   规定ediits文件最大值,一旦超过这个值则强制checkpoint,不管是否到最大时间间隔,默认为64M

3、SecondeNameNode对editslog、fsimage文件同步合并方式

(1)、当editslog文件写满时,NameNode向SecondeNameNode发出请求,通知SecondeNameNode进行文件editslog与fsimage合并。

(2)、SecondeNameNode做出响应,并通知NameNode创建新文件edits.new,且向edits.new文件写入元数据

(3)、SecondeNameNode下载editslog、fsimage文件到SecondeNameNode主机

(4)、SecondeNameNode将下载editslog、fsimage文件做同步合并合并文件为:fsimage.chkpoint

(5)、将合并文件fsimage.chepoint上传到NameNode中fsimage同目录

(6)、重命名fsimage.chepoint文件为fsimage

(7)、重命名edits.new为edits

4、nameNode 元数据存储格式

nameNode(FileName、replicas、block-ids、id2host。。。)

名词解释:FileName:文件名称

replicas:副本个数

block-ids:blockid

后面是文件在dataNode位置

列:/home/test.log,3,{blk_1,blk_2},[{blk_1:[h0,h1,h2]},{blk_2:[h0,h1,h2]}]

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值