联邦
联邦 ---- 解决性能瓶颈 ---- 每台服务器都是有性能极限的。
正常情况下,每一个集群都只有一个 NN 处于 active 状态,只会有一个 namespace。
特点
NN 都处于 active 状态,相互隔离无通信。
多个 NN 通过 clusterID 建立连接。
当元数据信息一个 NN 已经无法存储了,超过了他的一个上限,即使用联邦。
我们不使用联邦的原因 ---- 极小的概率会造成 NN 存储不了。
联邦中,每一个 NN 自成个体,也就是说 namenode 是单独的,他也可以进行 HA 操作。
联邦之后,DN 的资源利用率的到提高。
部署运维方便,只部署一套集群,就可以进行两个业务的处理,维护只需要进行一个集群就可以。
缺点:
虽然是一个集群,但是有两个 active 状态的 NN,当你提交任务时,你要选择使用哪一个 NN。