Secondary NameNode工作原理

一、NameNode 和 Secondary NameNode工作机制

工作流程图

1 )第一阶段: NameNode 启动
 
1 )第一次启动 NameNode 格式化后,创建 Fsimage Edits 文件。如果不是第一次启动,直接加载编辑日志和镜像文件到内存。
2 )客户端对元数据进行增删改的请求。
3 NameNode 记录操作日志,更新滚动日志。
4 NameNode 在内存中对元数据进行增删改。
 
2 )第二阶段: Secondary NameNode 工作
 
1 Secondary NameNode 询问 NameNode 是否需要 CheckPoint 。直接带回 NameNode
是否检查结果。
2 Secondary NameNode 请求执行 CheckPoint
3 NameNode 滚动正在写的 Edits 日志。
4 )将滚动前的编辑日志和镜像文件拷贝到 Secondary NameNode
5 Secondary NameNode 加载编辑日志和镜像文件到内存,并合并。
6 )生成新的镜像文件 fsimage.chkpoint
7 )拷贝 fsimage.chkpoint NameNode
8 NameNode fsimage.chkpoint 重新命名成 fsimage

二、CheckPoint 时间设置

2.1 通常情况下, SecondaryNameNode 每隔一小时执行一次。
2.2 一分钟检查一次操作次数,当操作次数达到 1 百万时, SecondaryNameNode 执行一次。
推荐阅读:尚硅谷官网--大数据视频教程。良心商家、没有给我任何广告费,如有侵权,请联系删除。
这篇博客也可以,写的很全:  https://www.cnblogs.com/yinzhengjie/p/10679254.html

虽然画的很复杂,但是我还是觉得尚硅谷讲的很清晰。感兴趣的可以参考上面大佬的博客。

三、NameNode故障处理

3.1方法一

将SecondaryNameNode中数据拷贝到NameNode存储数据的目录

  1. kill -9 NameNode对应的进程
  2. 删除NameNode存储数据
    rm -rf /opt/module/hadoop-2.8.3/data/tmp/dfs/name/
  3. 拷贝SecondaryNameNode中数据到原NameNode存储数据目录
    scp -r hadoop@hadoop-102:/opt/module/hadoop-2.8.3/data/tmp/dfs/namesecondary/* ./name
  4. 重新启动NameNode

3.2方法二

使用-importCheckpoint选项启动NameNode守护进程,从而将SecondaryNameNode中数据拷贝到NameNode目录中

1、修改hdfs-site.xml
<property>
 <name>dfs.namenode.checkpoint.period</name>
 <value>120</value>
</property>

<property>
 <name>dfs.namenode.name.dir</name>
 <value>/opt/module/hadoop-2.7.2/data/tmp/dfs/name</value>
</property>

2、kill -9 namenode进程

3、删除NameNode存储的数据
rm -rf /opt/module/hadoop-2.8.3/data/tmp/dfs/name/

4、如果SecondaryNameNode不和NameNode在一个主机节点上,需要将SecondaryNameNode存储数据的目录拷贝到NameNode存储数据的平级目录,并删除in_use.lock文件
在dfs目录下执行
scp -r hadoop@hadoop-102:/opt/module/hadoop-2.8.3/data/tmp/dfs/namesecondary ./
进入namesecondary目录,删除in_use.lock文件
cd namesecondary
rm -rf in_use.lock

5、导入检查点数据(等待一会ctrl+c结束掉)
hdfs namenode -importCheckpoint

6、启动namenode
hadoop-daemon.sh start namenode

四、集群安全模式

4.1概述

NameNode启动时,首先将映像文件(fsimage)载入内存,并执行编辑日志(edits)中的各项操作。一旦在内存中成功建立文件系统元数据的映像,则创建一个新的fsimage文件和一个空的编辑日志。此时,NameNode开始监听DataNode请求。但是此刻,NameNode运行在安全模式,即NameNode的文件系统对于客户端来说是只读的。
系统中的数据块的位置并不是由NameNode维护的,而是以块列表的形式存储在DataNode中。在系统的正常操作期间,NameNode会在内存中保留所有块位置的映射信息。在安全模式下,各个DataNode会向NameNode发送最新的块列表信息,NameNode了解到足够多的块位置信息之后,即可高效运行文件系统。
如果满足“最小副本条件”,NameNode会在30秒钟之后就退出安全模式。所谓的最小副本条件指的是在整个文件系统中99.9%的块满足最小副本级别(默认值:dfs.replication.min=1)。在启动一个刚刚格式化的HDFS集群时,因为系统中还没有任何块,所以NameNode不会进入安全模式。

4.2基本语法

集群处于安全模式,不能执行重要操作(写操作)。集群启动完成后,自动退出安全模式。

  1. bin/hdfs dfsadmin -safemode get (功能描述:查看安全模式状态)
  2. bin/hdfs dfsadmin -safemode enter (功能描述:进入安全模式状态)
  3. bin/hdfs dfsadmin -safemode leave (功能描述:离开安全模式状态)
  4. bin/hdfs dfsadmin -safemode wait (功能描述:等待安全模式状态,监控安全模式)

参考:https://www.jianshu.com/p/53e40d3b0f7d

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值