Hadoop-HDFS之Namenode操作及原理

Namenode

Namenode的元数据存储

如下图,由于我在hadoop1上启动了namenode和datanode,会产生如下两个文件夹,name是namenode存放的元数据,而data是datanode存放的块的数据。

在这里插入图片描述下面是存放元数据的两种重要文件,日志文件edits,快照文件fsimage
在这里插入图片描述

1.NN的作用
		NN保存HDFS上所有文件的元数据!
		NN负责接受客户端的请求!
		NN负责接受DN上报的信息,给DN分配任务(维护副本数)2.元数据的存储
		元数据存储在fsiamge文件+edits文件中!
		
		fsimage(元数据的快照文件)
		edits(记录所有写操作的文件)
		**如果你看了我之前写的redis教程,以上两个文件应该很好理解。**
		NN负责集群中所有客户端的请求和所有DN的请求!在一个集群中,通常NN需要一个高配置,保证NN
		可以及时处理客户端或DN的请求,一旦NN无法及时处理请求,HDFS就已经瘫痪!
fsimage文件的产生:
	
		①第一次格式化NN时,此时会创建NN工作的目录,其次在目录中生成一个
		fsimage_000000000000文件
		
		②当NN在启动时,NN会将所有的edits文件和fsiamge文件加载到内存合并得到最新的元数据,将
		元数据持久化到磁盘生成新的fsimage文件
		③如果启用了secondarynamenode,也会辅助NN合并元数据,会将合并后的元数据发送到NN
edits:
			NN在启动之后,每次接受的写操作请求,都会将写命令记录到edits文件中,edits文件每间隔
			一定的时间和大小滚动!		

当我把namenode格式化以后, 每次格式化NN,会产生一个VERSION文件
VERSION记录的是NN的集群的信息

	每次格式化NN时,重新生成clusterID和
	blockpoolID(会被DN领取,生成一个同名的目录,每次DN启动时,会将这个同名目录中的块上报NN)

当namenode被格式化后,datanode里面的那些块也将失去意义,因为是靠元数据去找这些块的,现在元数据都没了还怎么找块?所以就将三台机子的datanode的data目录删掉,然后将namenode启动,再将三台机子的datanode启动,datanode会根据namenode重新加入集群,clusterid一定要一致。DN在第一次启动时,如果没有VERSION信息,会向配置文件中配置的NN发起请求,生成VERSION,加入到集群!(具体操作看下一个小标题的内容)
然后我们看一下namenode的version文件。
在这里插入图片描述再看一下datanode的BP-128.。。。。
在这里插入图片描述我们会发现namenode里的blockpoolid就是datanode存放块的文件夹的名字。

edits文件与fsimage文件

为了说明edits与fsimage,我将hadoop1的namenode格式化,然后将三台机子的datanode的数据都删掉,重新搭建一个集群。()
在这里插入图片描述然后我们看一下namenode里的元数据,就只有fsimage了,因为恢复到了出场设置,我还没对该hdfs做写操作,所以没有edits文件产生。
在这里插入图片描述下面我们将之前三个datanode的data目录删掉,然后启动datanode,然后会重新同步格式化后的namenode,产生新的data目录。(secondarynamenode的version所在的那个secondname文件夹也删掉吧,要保证集群号一致,所以就让它重新生成)
在这里插入图片描述 然后运行namenode。
在这里插入图片描述然后群起三台机子的datanode。
在这里插入图片描述然后看一下namenode的情况,发现已经有edits文件产生了。
在这里插入图片描述然后上传一个文件abc.txt
在这里插入图片描述 然后查看edits文件用以下命令,也就是将该edits文件以xml形式输出。
在这里插入图片描述
如下图,我们可以很清楚的看到edits文件里做了什么事,它保存了我们做的写操作。
在这里插入图片描述edits手动滚动:(edits可以自动滚动,但是我这数据量少,我就手动滚动来演示一下)
我们可以看到直接滚动到编号为9的edits日志文件上了,也就是所我下一次对hdfs做了写操作,是从第9个edits开始记录的
在这里插入图片描述fsimage也可以手动滚动,也可以自动,我们演示手动。
在这里插入图片描述

在这里插入图片描述

经过之前的操作,我们发现重启namenode后,会自动把最新的fsimage和edits合并,然后checkpoint就是合并的那一个时间点。
在这里插入图片描述然后我们来看看fsimage里是什么样的。
在这里插入图片描述在这里插入图片描述NN的元数据分两部分:
①inodes : 记录在fsimage文件中或edits文件中
②blocklist: 块的位置信息(每次DN在启动后,自动上报的)
在这里插入图片描述 如上图,红框部分是保存在fsimage里的,而Availability是各节点自动上报的。

Namenode的安全模式

NN的启动过程
①先加载fsimage_000000xx文件
②将fsimage文件xx之后的edits文件加载
③合并生成最新的元数据,记录checkpoint,如果满足要求,执行saveNamespace操作,不满足等满足后执行
saveNamespace操作必须在安全模式执行

④自动进入安全模式,等待DN上报块
		DN上报的块的最小副本数总和 / 块的总数  > 0.999,自动在30s离开安全模式!
		
		安全模式只能有限读,不能写!

在这里插入图片描述wait命令是进入安全模式后执行,可以将写命令缓存起来当我结束安全模式之后,将缓存的写命令自动执行。
在这里插入图片描述

SecondaryNamenode原理

在这里插入图片描述

Fsimage:NameNode内存中元数据序列化后形成的文件。
Edits:记录客户端更新元数据信息的每一步操作(可通过Edits运算出元数据)。
NameNode启动时,先滚动Edits并生成一个空的edits.inprogress,然后加载Edits和Fsimage到内存中,此时NameNode内存就持有最新的元数据信息。Client开始对NameNode发送元数据的增删改的请求,这些请求的操作首先会被记录到edits.inprogress中(查询元数据的操作不会被记录在Edits中,因为查询操作不会更改元数据信息),如果此时NameNode挂掉,重启后会从Edits中读取元数据的信息。然后,NameNode会在内存中执行元数据的增删改的操作。
由于Edits中记录的操作会越来越多,Edits文件会越来越大,导致NameNode在启动加载Edits时会很慢,所以需要对Edits和Fsimage进行合并(所谓合并,就是将Edits和Fsimage加载到内存中,照着Edits中的操作一步步执行,最终形成新的Fsimage)。SecondaryNameNode的作用就是帮助NameNode进行Edits和Fsimage的合并工作。
SecondaryNameNode首先会询问NameNode是否需要CheckPoint(触发CheckPoint需要满足两个条件中的任意一个,定时时间到和Edits中数据写满了)。直接带回NameNode是否检查结果。SecondaryNameNode执行CheckPoint操作,首先会让NameNode滚动Edits并生成一个空的edits.inprogress,滚动Edits的目的是给Edits打个标记,以后所有新的操作都写入edits.inprogress,其他未合并的Edits和Fsimage会拷贝到SecondaryNameNode的本地,然后将拷贝的Edits和Fsimage加载到内存中进行合并,生成fsimage.chkpoint,然后将fsimage.chkpoint拷贝给NameNode,重命名为Fsimage后替换掉原来的Fsimage。NameNode在启动时就只需要加载之前未合并的Edits和Fsimage即可,因为合并过的Edits中的元数据信息已经被记录在Fsimage中。

1)通常情况下,SecondaryNameNode每隔一小时执行一次。
	
<property>
  <name>dfs.namenode.checkpoint.period</name>
  <value>3600</value>
</property >2)一分钟检查一次操作次数,当操作次数达到1百万时,SecondaryNameNode执行一次。
<property>
  <name>dfs.namenode.checkpoint.txns</name>
  <value>1000000</value>
<description>操作动作次数</description>
</property>

<property>
  <name>dfs.namenode.checkpoint.check.period</name>
  <value>60</value>
<description> 1分钟检查一次操作次数</description>
</property >

元数据的恢复和元数据的备份

恢复:
如果我把namenode的current目录删了,那么元数据就找不到了,但是我可以将secondarynamenode的current目录原封不动的复制过来,这可以回复一部分元数据。恢复多少取决于你的运气,如果secondarynamenode恰好刚刚做了一次合并,那么就很棒了,你就可以找回所有数据。
备份:
我直接一开始就给namenode多配置一个目录用来存元数据。
在这里插入图片描述

  • 12
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值