一、联邦的介绍
联邦就是将多个NameNode公用一群DataNode来存储数据。每个NameNode都有自己的目录树,他们在DataNode上使用不同的目录存储自己的HDFS文件块,互不通信,互不干扰,谁也不知道谁
二、使用联邦的原因
因为NameNode把目录树保存在内存中,而内存是有限的,一个NameNode可以管理的文件数量有限,而DataNode通过添加节点可以认为是无限的,于是NameNode的能力无法匹配DataNode的容量,为了避免浪费DataNode就出现了联邦
三、名字空间NameSpace
- 在联邦中,NameNode可以配置成高可用的,即两个NameNode为一对(一个Active,一个Standby),管理一棵目录树,对外作为一个独立的HDFS服务,这个就叫做NameSpace
- 一个NameSpace对应一棵目录树和目录树所管理的那些文件块