HDFS元数据的持久化操作

1.什么是元数据

元数据是存储HDFS重要信息的元素
按类型可分为

  1. 文件、目录自身的属性信息,例如文件名、目录名、修改信息等
  2. 文件记录的信息的存储相关的信息,例如存储块信息、分块情况、副本个数等。
    3.记录HDFS和DataNode的信息,用于DataNode的管理。
    按形式可分为:内存元数据和元数据文件两种,分别存储在内存和磁盘。

2.为什么需要元数据的持久化

元数据重要,且使用内存存储,存在安全风险,因此需要持久化操作,规避风险。

3.元数据的持久化操作

在这里插入图片描述
在这里插入图片描述

  1. 在HDFS 第一次格式化后,NameNode就会生成fsimage和editslog两个文件。
  2. SecondaryNamenode 节点定期从NameNode下载fsimage和editslog两个文件。
  3. 把fsimage和editslog结合成新的fsimage快照文件。
  4. 替换NameNode的fsimage文件,并将new_editslog重命名为editslog,组成新的fsimage和editslog。
  5. 为了避免editlog不断增加,secondary namenode会周期性合并fsimage和edits成新的fsimage
  6. 这样周期性操作,使得NameNode的fsimage和editslog相差一段时间。

1.NameNode和SecondaryNameNode的区别?

  1. NameNode主要维护两个组件,一个是fsimage一个是editslog.
  2. fsimage保存了最新的元数据检查点,包含了整个HDFS文件系统的所有目录和文件的信息。对于文件来说包括了数据块描述信息、修改时间、访问时间等;对于目录来说包括修改时间、访问权限控制信息(目录所属用户,所在组)等
  3. editlog主要是在NameNode已经启动情况下对HDFS进行的各种更新操作进行记录,HDFS客户端执行所有的写操作都会被记录到editlog中。
  • 4
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值