一.什么是联邦
联邦就是将多个NameNode公用一群DataNode来存储数据。每个NameNode都有自己的目录树,他们在DataNode上使用不同的目录存储自己的HDFS文件块,互不通信,互不干扰,谁也不知道谁
二.为什么需要联邦
因为NameNode把目录树存在内存中,而内存是有限的,一个NameNode可以管理的文件数量有限,而DataNode通过添加节点可以认为是无限的,于是NameNode的能力无法匹配DataNode的容量,为了避免浪费DataNode就出现了“联邦”
三.NameSpace(名字空间)
在联邦中,NameNode可以配置成高可用的,即两个NameNode为一对(一个Active,一个Standby),管理一颗目录树,对外作为一个独立的HDFS服务,并给它取了一个新的名字:NameSpace(名字空间),所以一个NameSpace对应一颗目录树和目录树所管理的那些文件块