1.命名空间:namespace
在伪分布式中hadoop的访问地址是 hdfs://ip:9000/ 。ip是NN节点所在的地址。但是在HA中NN 的ip是多个的此时,若NN发生切换生产中的,我们原有的程序难道需要重新编写?这时提供了命名空间的概念,客户端通过hdfs://namespace:9000/ 访问hdfs,无需关注具体访问的NN地址,用户无感知。
注意:1、namespace不是进程,而是配置映射。
2、客户端通过包含namespace的请求去寻找active状态的机器进行通信,n。
2.HDFS HA架构图
注意ÿ