Hadoop-HDFS之Namenode操作及原理

最新推荐文章于 2025-04-03 10:42:33 发布

ygpGoogle

最新推荐文章于 2025-04-03 10:42:33 发布

阅读量8.5k

点赞数 12

分类专栏： hadoop 文章标签： hadoop hdfs

本文链接：https://blog.csdn.net/ygp12345/article/details/108931077

版权

hadoop 专栏收录该内容

20 篇文章

订阅专栏

文章目录

- Namenode

Namenode

Namenode的元数据存储

如下图，由于我在hadoop1上启动了namenode和datanode，会产生如下两个文件夹，name是namenode存放的元数据，而data是datanode存放的块的数据。

在这里插入图片描述下面是存放元数据的两种重要文件，日志文件edits，快照文件fsimage

1.NN的作用
		NN保存HDFS上所有文件的元数据！
		NN负责接受客户端的请求！
		NN负责接受DN上报的信息，给DN分配任务(维护副本数)！
		
2.元数据的存储
		元数据存储在fsiamge文件+edits文件中！
		
		fsimage(元数据的快照文件)
		edits(记录所有写操作的文件)
		**如果你看了我之前写的redis教程，以上两个文件应该很好理解。**
		NN负责集群中所有客户端的请求和所有DN的请求！在一个集群中，通常NN需要一个高配置，保证NN
		可以及时处理客户端或DN的请求，一旦NN无法及时处理请求，HDFS就已经瘫痪！
fsimage文件的产生：
	
		①第一次格式化NN时，此时会创建NN工作的目录，其次在目录中生成一个
		fsimage_000000000000文件
		
		②当NN在启动时，NN会将所有的edits文件和fsiamge文件加载到内存合并得到最新的元数据，将
		元数据持久化到磁盘生成新的fsimage文件
		③如果启用了secondarynamenode,也会辅助NN合并元数据，会将合并后的元数据发送到NN
edits：
			NN在启动之后，每次接受的写操作请求，都会将写命令记录到edits文件中，edits文件每间隔
			一定的时间和大小滚动！

当我把namenode格式化以后，每次格式化NN，会产生一个VERSION文件
VERSION记录的是NN的集群的信息

	每次格式化NN时，重新生成clusterID和
	blockpoolID(会被DN领取，生成一个同名的目录，每次DN启动时，会将这个同名目录中的块上报NN)

当namenode被格式化后，datanode里面的那些块也将失去意义，因为是靠元数据去找这些块的，现在元数据都没了还怎么找块？所以就将三台机子的datanode的data目录删掉，然后将namenode启动，再将三台机子的datanode启动，datanode会根据namenode重新加入集群，clusterid一定要一致。DN在第一次启动时，如果没有VERSION信息，会向配置文件中配置的NN发起请求，生成VERSION，加入到集群！(具体操作看下一个小标题的内容)
然后我们看一下namenode的version文件。
在这里插入图片描述再看一下datanode的BP-128.。。。。
我们会发现namenode里的blockpoolid就是datanode存放块的文件夹的名字。

edits文件与fsimage文件

为了说明edits与fsimage,我将hadoop1的namenode格式化，然后将三台机子的datanode的数据都删掉，重新搭建一个集群。()
在这里插入图片描述然后我们看一下namenode里的元数据，就只有fsimage了，因为恢复到了出场设置，我还没对该hdfs做写操作，所以没有edits文件产生。
下面我们将之前三个datanode的data目录删掉，然后启动datanode，然后会重新同步格式化后的namenode，产生新的data目录。(secondarynamenode的version所在的那个secondname文件夹也删掉吧，要保证集群号一致，所以就让它重新生成)
在这里插入图片描述然后运行namenode。
然后群起三台机子的datanode。
然后看一下namenode的情况，发现已经有edits文件产生了。
然后上传一个文件abc.txt
然后查看edits文件用以下命令，也就是将该edits文件以xml形式输出。

如下图，我们可以很清楚的看到edits文件里做了什么事，它保存了我们做的写操作。
在这里插入图片描述 edits手动滚动：(edits可以自动滚动，但是我这数据量少，我就手动滚动来演示一下)
我们可以看到直接滚动到编号为9的edits日志文件上了，也就是所我下一次对hdfs做了写操作，是从第9个edits开始记录的
fsimage也可以手动滚动，也可以自动，我们演示手动。
在这里插入图片描述

在这里插入图片描述

经过之前的操作，我们发现重启namenode后，会自动把最新的fsimage和edits合并，然后checkpoint就是合并的那一个时间点。
在这里插入图片描述然后我们来看看fsimage里是什么样的。
NN的元数据分两部分：
①inodes : 记录在fsimage文件中或edits文件中
②blocklist: 块的位置信息（每次DN在启动后，自动上报的）
如上图，红框部分是保存在fsimage里的，而Availability是各节点自动上报的。

Namenode的安全模式

NN的启动过程
①先加载fsimage_000000xx文件
②将fsimage文件xx之后的edits文件加载
③合并生成最新的元数据，记录checkpoint，如果满足要求，执行saveNamespace操作，不满足等满足后执行
saveNamespace操作必须在安全模式执行

④自动进入安全模式，等待DN上报块
		DN上报的块的最小副本数总和 / 块的总数  > 0.999,自动在30s离开安全模式！
		
		安全模式只能有限读，不能写！

在这里插入图片描述 wait命令是进入安全模式后执行，可以将写命令缓存起来当我结束安全模式之后，将缓存的写命令自动执行。

SecondaryNamenode原理

在这里插入图片描述

Fsimage：NameNode内存中元数据序列化后形成的文件。
Edits：记录客户端更新元数据信息的每一步操作（可通过Edits运算出元数据）。
NameNode启动时，先滚动Edits并生成一个空的edits.inprogress，然后加载Edits和Fsimage到内存中，此时NameNode内存就持有最新的元数据信息。Client开始对NameNode发送元数据的增删改的请求，这些请求的操作首先会被记录到edits.inprogress中（查询元数据的操作不会被记录在Edits中，因为查询操作不会更改元数据信息），如果此时NameNode挂掉，重启后会从Edits中读取元数据的信息。然后，NameNode会在内存中执行元数据的增删改的操作。
由于Edits中记录的操作会越来越多，Edits文件会越来越大，导致NameNode在启动加载Edits时会很慢，所以需要对Edits和Fsimage进行合并（所谓合并，就是将Edits和Fsimage加载到内存中，照着Edits中的操作一步步执行，最终形成新的Fsimage）。SecondaryNameNode的作用就是帮助NameNode进行Edits和Fsimage的合并工作。
SecondaryNameNode首先会询问NameNode是否需要CheckPoint（触发CheckPoint需要满足两个条件中的任意一个，定时时间到和Edits中数据写满了）。直接带回NameNode是否检查结果。SecondaryNameNode执行CheckPoint操作，首先会让NameNode滚动Edits并生成一个空的edits.inprogress，滚动Edits的目的是给Edits打个标记，以后所有新的操作都写入edits.inprogress，其他未合并的Edits和Fsimage会拷贝到SecondaryNameNode的本地，然后将拷贝的Edits和Fsimage加载到内存中进行合并，生成fsimage.chkpoint，然后将fsimage.chkpoint拷贝给NameNode，重命名为Fsimage后替换掉原来的Fsimage。NameNode在启动时就只需要加载之前未合并的Edits和Fsimage即可，因为合并过的Edits中的元数据信息已经被记录在Fsimage中。

（1）通常情况下，SecondaryNameNode每隔一小时执行一次。
	
<property>
  <name>dfs.namenode.checkpoint.period</name>
  <value>3600</value>
</property >
（2）一分钟检查一次操作次数，当操作次数达到1百万时，SecondaryNameNode执行一次。
<property>
  <name>dfs.namenode.checkpoint.txns</name>
  <value>1000000</value>
<description>操作动作次数</description>
</property>

<property>
  <name>dfs.namenode.checkpoint.check.period</name>
  <value>60</value>
<description> 1分钟检查一次操作次数</description>
</property >

元数据的恢复和元数据的备份

恢复：
如果我把namenode的current目录删了，那么元数据就找不到了，但是我可以将secondarynamenode的current目录原封不动的复制过来，这可以回复一部分元数据。恢复多少取决于你的运气，如果secondarynamenode恰好刚刚做了一次合并，那么就很棒了，你就可以找回所有数据。
备份：
我直接一开始就给namenode多配置一个目录用来存元数据。
在这里插入图片描述