hadoop3.X版本特性:联邦-viewFs

本文深入探讨了Hadoop 3.x版本的联邦特性,包括命名空间的扩展、性能提升和数据隔离。此外,介绍了ViewFs的概念,它是如何在多个集群间提供全局命名空间,并详细阐述了配置和使用ViewFs的最佳实践。
摘要由CSDN通过智能技术生成

2020/11/10 shq000912@163.com

一、Federation(联邦)

1.1背景(HDFS的两个层面)

命名空间:

  • 命名空间:由目录,文件和块组成。
  • 它支持所有与名称空间相关的文件系统操作,例如创建,删除,修改和列出文件和目录

块存储服务:

  • Block管理:

    • 提供datanode集群的注册和定期的心跳检查,处理block的报告并掌握block的位置;
    • 支持block的相关操作,如增删改查和得到block的位置管理副本位置,管理副本的复制和删除
  • 存储:本地系统的datanodes提供,允许读写。

↑before:整个集群使用单个NameNode,共用一个nameSpace

↓then:向HDFS添加多个NameNode,nameSpace

1.2联邦的概念

多nameNode&nameSpace:

  • 多个NameNode相互独立,使得HDFS的命名服务能够水平扩展,这些NN分别进行各自命名空间和块的管理,不需要彼此协调

  • 多个NameSpace管理属于自己的一组块,这些属于同一个命名空间的块组成一个块池

  • DataNode

    • 被所有NameNode使用,作为通用的数据块存储设备

    • 向联邦中每一个NameNode注册

    • 向NameNode发送心跳机制以及block报告

    • 处理NameNode的命令

    • 每个datanode为多个块池提供存储

Block池:

  • 每个块池存储同一个nameSpace里的所有文件的块集合

  • 被独立管理,互不影响

  • 块存储在不同的DataNode中的

→允许为新的block产生Block ID并不会需要其他的namespace。一个NameNode出问题也不会影响datanode为集群中的其他NameNode服务。

  • NameSpace与块池绑定一起称为NameSpaceVolume,作为一个独立的单位进行管理
  • 当nameNode/nameSpace被删除时,对应的block池也被删除

→当集群升级时,一个NameSpaceVolume是一个升级单元

集群ID:

  • ClusterID用来标识以及识别集群中的所有节点,格式化NameNode时,Cluster自动生成。
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值