hdfs100问


title: hdfs100问
tags:
grammar_cjkRuby: true

1.hdfs架构

enter description here
  和zookeeper的写流程的管理手段非常像,都是作为分布式存储的,二级结构。

2.namenode格式化是什么 为什么要进行

enter description here
格式化就是相当于格式化磁盘一样,清楚索引块信息,重新使用hdfs物理存储。

3.namenode宕机数据恢复

通常来说一些比较大的文件(例如10T),都会分布式地存储在多个服务器的磁盘中去,文件的元数据都会保存在NameNode中去,文件的访问修改时间,文件的副本个数,以及block大小以及组成文件的block信息,文件的内容保存在DataNode中。为了能够在启动时快速加载这些文件信息(元数据),这些信息都会保存在内存中去。但是只要namenode所在的服务器关机,这些信息就会马上丢失,所以就有了两种方式在NameNode本地持久化:命名空间镜像文件(fsimage)和编辑日志(edits log)

enter description here

VERSION文件是一个Java的属性文件
enter description here

namespaceID是该文件系统的唯一标志符,当NameNode第一次格式化的时候生成

clusterID是HDFS集群使用的一个唯一标志符,在HDFS联邦的情况下,就看出它的作用了,因为联邦情况下,集群有多个命名空间不同的命名空间由不同的NameNode管理

blockpoolID是block池的唯一标志符,一个NameNode管理一个命名空间,该命名空间中的所有文件存储的block都在block池中。

edits表示edits log日志文件

fsimage表示文件系统元数据镜像文件

enter description here

3.0Fsimage和edits概念

enter description here

3.1edits文件如何防止事务丢失/secondnamenode如何加速数据恢复

edits log在磁盘上表现为一定数量的文件。每个文件称为片段(Segment),前缀“edits”,后缀是其中包含的事务ID(transaction IDs)。每个写操作事务都仅仅打开一个文件(比如:edits_inprogress_00000000000010),写完后冲刷缓冲区并同步到磁盘,然后返回客户端success状态码。如果NameNode的元数据需要写到多个目录中,则对于每个写事务需要所有的写操作都完成</

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值