五、NameNode和SecondaryNameNode的介绍

一、NN和SNN工作机制

         了解hadoop的一定不会陌生NameNode和SecondaryNameNode这两个组件,NameNode是保存数据元信息,SecondaryNameNode是帮助NN工作,也可以做元数据备份工作。

在这里插入图片描述


1.第一阶段:NameNode启动
(1)第一次启动NameNode格式化后,创建fsimage和edits文件。如果不是第一次启动,直接加载编辑日志和镜像文件到内存。
(2)客户端对元数据进行增删改的请求。
(3)NameNode记录操作日志,更新滚动日志。
(4)NameNode在内存中对数据进行增删改查。


2.第二阶段:Secondary NameNode工作
(1)Secondary NameNode询问NameNode是否需要checkpoint。直接带回NameNode是否检查结果。
(2)Secondary NameNode请求执行checkpoint。
(3)NameNode滚动正在写的edits日志,将后续操作写入新的edits日志文件
(4)将滚动前的编辑日志和镜像文件拷贝到Secondary NameNode。
(5)Secondary NameNode加载编辑日志和镜像文件到内存,并合并。
(6)生成新的镜像文件fsimage.chkpoint。
(7)拷贝fsimage.chkpoint到NameNode。
(8)NameNode将fsimage.chkpoint重新命名成fsimage。
(9)此时fsimage与滚动后的edits编辑日志就是最新元数据


3. NN和2NN工作机制详解:

Fsimage:NameNode内存中元数据序列化后形成的文件。

Edits:记录客户端更新元数据信息的每一步操作(可通过Edits运算出元数据)。


3.1 集群启动时做了哪些工作?

1.NameNode启动工作:启动合并数据

       NameNode启动时,先滚动Edits并生成一个空的edits.inprogress,然后加载Edits和Fsimage到内存中,此时NameNode内存就持有最新的元数据信息。


2.客户端对文件操作记录:编辑日志

       Client开始对NameNode发送元数据的增删改的请求,这些请求的操作首先会被记录到edits.inprogress中(查询元数据的操作不会被记录在Edits中,因为查询操作不会更改元数据信息),如果此时NameNode挂掉,重启后会从Edits中读取元数据的信息。然后,NameNode会在内存中执行元数据的增删改的操作。


3.随着操作记录越来越多Edits文件过大,会导致NameNode启动缓慢

       由于Edits中记录的操作会越来越多,Edits文件会越来越大,导致NameNode在启动加载Edits时会很慢,所以需要对Edits和Fsimage进行合并(所谓合并,就是将Edits和Fsimage加载到内存中,照着Edits中的操作一步步执行,最终形成新的Fsimage)。SecondaryNameNode的作用就是帮助NameNode进行Edits和Fsimage的合并工作。


4.SecondaryNameNode触发执行元数据备份流程

       1. SecondaryNameNode首先会询问NameNode是否需要CheckPoint(触发CheckPoint需要满足两个条件中的任意一个,定时时间到和Edits中数据写满了-文件操作次数)。直接带回NameNode是否检查结果。
       2. SecondaryNameNode执行CheckPoint操作,首先会让NameNode滚动Edits并生成一个空的edits.inprogress,滚动Edits的目的是给Edits打个标记,以后所有新的操作都写入edits.inprogress,其他未合并的Edits和Fsimage会拷贝到SecondaryNameNode的本地。
       3. 然后将拷贝的Edits和Fsimage加载到内存中进行合并,生成fsimage.chkpoint。
       4. 然后将fsimage.chkpoint拷贝给NameNode,重命名为Fsimage后替换掉原来的Fsimage
       5.NameNode在启动时就只需要加载之前未合并的Edits和Fsimage即可,因为合并过的Edits中的元数据信息已经被记录在Fsimage中。

注意:每次SecondaryNameNode合并一次数据将生成一个新的edits操作文件。









二、Fsimage和Edits解析

1、NameNode下数据文件介绍
       集群搭建完毕启动前需要先格式化NameNode,NameNode被格式化后,会在/opt/module/hadoop-2.7.2/data/tmp/dfs/name/current 目录下生成文件:seen_txid、VERSION、fsimage、edits

       1.1 fsimage文件:HDFS文件系统元数据的一个永久性的检查点,其中包含HDFS文件系统的所有目录和文件inode的序列化信息
       1.2 edits文件:存放HDFS文件系统的所有更新操作的路径,文件系统客户端执行的所有写操作首先会被记录到Edits文件中。
       1.3 seen_txid:保存的是最后一个edits_ 的数字
       1.4 每次 NameNode 启动的时候会将fsimage文件读入内存,加载edits里面的更新操作,保证内存中的元数据信息是最新的、同步的,可以看成NameNode启动时将fsimage与edits文件进行了合并


2、使用oiv查看Fsimage文件

操作如下:

(1)查看oiv和oev命令介绍
[root@hadoop102 current]$ hdfs
oiv            apply the offline fsimage viewer to an fsimage
oev            apply the offline edits viewer to an edits file

(2)基本语法
hdfs oiv -p 文件类型 -i镜像文件 -o 转换后文件输出路径

(3)案例实操
[root@hadoop102 current]$ pwd
/opt/module/hadoop-2.7.2/data/tmp/dfs/name/current
[root@hadoop102 current]$ hdfs oiv -p XML -i fsimage_0000000000000000025 -o /opt/module/hadoop-2.7.2/fsimage.xml
[root@hadoop102 current]$ cat /opt/module/hadoop-2.7.2/fsimage.xml

查看生成的fsimage.xml文件部分数据

在这里插入图片描述

文件信息:
<inode>
    <id>21058</id>
    <type>FILE</type> 类型
    <name>2.txt</name> 文件名
    <replication>3</replication> 备份数量
    <mtime>1588771338974</mtime> 最后操作时间1588771338,去掉后三位转换格式
    <atime>1588771338686</atime>
    <perferredBlockSize>134217728</perferredBlockSize> 剩余的块存储空间
    <permission>root:supergroup:rw-r--r--</permission>权限
    <blocks>
        <block>
            <id>1073744178</id>
            <genstamp>3354</genstamp>
            <numBytes>271</numBytes> 文件大小
        </block>
    </blocks>
</inode>

数据块大小:(134217728+271)/1024/1024=128

目录信息:

<inode>
    <id>21055</id> 
    <type>DIRECTORY</type> 类型
    <name>test2</name>目录名
    <mtime>1588771338686</mtime>最后修改时间
    <permission>root:supergroup:rwxr-xr-x</permission>权限
    <nsquota>-1</nsquota>
    <dsquota>-1</dsquota>
</inode>

3、 oev查看Edits文件

(1)基本语法
hdfs oev -p 文件类型 -i编辑日志 -o 转换后文件输出路径
(2)案例实操
[root@hadoop102 current]$ hdfs oev -p XML -i edits_inprogress_0000000000000055469 -o /opt/module/hadoop-2.7.2/edits.xml
[root@hadoop102 current]$ cat /opt/module/hadoop-2.7.2/edits.xml

(3)将显示的xml文件内容拷贝到Eclipse中创建的xml文件中,并格式化。显示结果如下。

xml部分文件信息解读:
执行了三步操作:
1.创建文件夹test
2.上传本地hb.txt文件至hdfs
3.删除hdfs中hb.txt文件

<?xml version="1.0" encoding="UTF-8"?>
<EDITS>
  <EDITS_VERSION>-63</EDITS_VERSION> 版本
  <RECORD>
    <OPCODE>OP_START_LOG_SEGMENT</OPCODE>
    <DATA>
      <TXID>55469</TXID>
    </DATA>
  </RECORD>

  <RECORD>
    <OPCODE>OP_MKDIR</OPCODE>  第一步创建文件夹
    <DATA>
      <TXID>55470</TXID>
      <LENGTH>0</LENGTH>
      <INODEID>31585</INODEID>
      <PATH>/test</PATH>
      <TIMESTAMP>1588771220227</TIMESTAMP>
      <PERMISSION_STATUS>
        <USERNAME>root</USERNAME> 创建用户
        <GROUPNAME>supergroup</GROUPNAME>
        <MODE>493</MODE>
      </PERMISSION_STATUS>
    </DATA>
  </RECORD>

  <RECORD>
    <OPCODE>OP_ADD</OPCODE>  第二步上传文件
    <DATA>
      <TXID>55471</TXID>
      <LENGTH>0</LENGTH>
      <INODEID>31586</INODEID>
      <PATH>/test/hb.txt._COPYING_</PATH> 文件地址
      <REPLICATION>3</REPLICATION>
      <MTIME>1588771259904</MTIME>
      <ATIME>1588771259904</ATIME>	操作时间
      <BLOCKSIZE>134217728</BLOCKSIZE> 数据块大小 128MB
      <CLIENT_NAME>DFSClient_NONMAPREDUCE_1441890911_1</CLIENT_NAME>
      <CLIENT_MACHINE>192.168.56.102</CLIENT_MACHINE> 客户端ip
      <OVERWRITE>true</OVERWRITE>
      <PERMISSION_STATUS>
        <USERNAME>root</USERNAME>
        <GROUPNAME>supergroup</GROUPNAME>
        <MODE>420</MODE>
      </PERMISSION_STATUS>
      <RPC_CLIENTID>09a6342a-82f4-4355-8b37-9e8f59252473</RPC_CLIENTID>
      <RPC_CALLID>3</RPC_CALLID>
    </DATA>
  </RECORD>

  <RECORD>
    <OPCODE>OP_ALLOCATE_BLOCK_ID</OPCODE>
    <DATA>
      <TXID>55472</TXID>
      <BLOCK_ID>1073744931</BLOCK_ID>
    </DATA>
  </RECORD>
  <RECORD>
    <OPCODE>OP_SET_GENSTAMP_V2</OPCODE>
    <DATA>
      <TXID>55473</TXID>
      <GENSTAMPV2>4159</GENSTAMPV2>
    </DATA>
  </RECORD>

  <RECORD>
    <OPCODE>OP_ADD_BLOCK</OPCODE>
    <DATA>
      <TXID>55474</TXID>
      <PATH>/test/hb.txt._COPYING_</PATH>
      <BLOCK>
        <BLOCK_ID>1073744931</BLOCK_ID>
        <NUM_BYTES>0</NUM_BYTES>
        <GENSTAMP>4159</GENSTAMP>
      </BLOCK>
      <RPC_CLIENTID></RPC_CLIENTID>
      <RPC_CALLID>-2</RPC_CALLID>
    </DATA>
  </RECORD>
  <RECORD>
    <OPCODE>OP_CLOSE</OPCODE>
    <DATA>
      <TXID>55475</TXID>
      <LENGTH>0</LENGTH>
      <INODEID>0</INODEID>
      <PATH>/test/hb.txt._COPYING_</PATH>
      <REPLICATION>3</REPLICATION>
      <MTIME>1588771260459</MTIME>
      <ATIME>1588771259904</ATIME>
      <BLOCKSIZE>134217728</BLOCKSIZE>
      <CLIENT_NAME></CLIENT_NAME>
      <CLIENT_MACHINE></CLIENT_MACHINE>
      <OVERWRITE>false</OVERWRITE>
      <BLOCK>
        <BLOCK_ID>1073744931</BLOCK_ID>
        <NUM_BYTES>75</NUM_BYTES>
        <GENSTAMP>4159</GENSTAMP>
      </BLOCK>
      <PERMISSION_STATUS>
        <USERNAME>root</USERNAME>
        <GROUPNAME>supergroup</GROUPNAME>
        <MODE>420</MODE>
      </PERMISSION_STATUS>
    </DATA>
  </RECORD>

  <RECORD>
    <OPCODE>OP_RENAME_OLD</OPCODE>
    <DATA>
      <TXID>55476</TXID>
      <LENGTH>0</LENGTH>
      <SRC>/test/hb.txt._COPYING_</SRC>
      <DST>/test/hb.txt</DST>
      <TIMESTAMP>1588771260477</TIMESTAMP>
      <RPC_CLIENTID>09a6342a-82f4-4355-8b37-9e8f59252473</RPC_CLIENTID>
      <RPC_CALLID>8</RPC_CALLID>
    </DATA>
  </RECORD>


  <RECORD>
    <OPCODE>OP_DELETE</OPCODE>		第三步文件删除操作
    <DATA>
      <TXID>55483</TXID>
      <LENGTH>0</LENGTH>
      <PATH>/test/hb.txt</PATH>
      <TIMESTAMP>1588771323014</TIMESTAMP>
      <RPC_CLIENTID>4d68339f-75b2-46d9-9dc9-28dd59210124</RPC_CLIENTID>
      <RPC_CALLID>3</RPC_CALLID>
    </DATA>
  </RECORD>
</EDITS>


三、 CheckPoint时间设置

hdfs-default.xml:文件参数设置

(1)通常情况下,SecondaryNameNode每隔一小时执行一次。

<property>
  <name>dfs.namenode.checkpoint.period</name>
  <value>3600</value>
</property>

(2)一分钟检查一次操作次数,3当操作次数达到1百万时,SecondaryNameNode执行一次。

<property>
  <name>dfs.namenode.checkpoint.txns</name>
  <value>1000000</value>
<description>操作动作次数</description>
</property>

<property>
  <name>dfs.namenode.checkpoint.check.period</name>
  <value>60</value>
<description> 1分钟检查一次操作次数</description>
</property >
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值