一.前言
为什么需要Federation(联邦)?
HA虽然提供了两个名称节点,解决了单点故障问题,但某时刻只有一个是活动状态,并没有解决可扩展性,系统性能,隔离性问题。
Federation(联邦)设计了多个相互独立的名称节点,使命名服务能水平扩展,这些节点分别进行各自命名空间和块管理,相互之间是联邦关系,不需要相互协调,降低了复杂性。
Federation(联邦)的核心可以说是viewfs,这个技术像什么呢!通俗点讲,和nfs挂载有点类似,如下图viewfs提供了统一的挂载点app&doc,其背后对应不同节点,客户端实际请求的资源&服务是由各自对应节点提供的,通过这种方式解决了上述HA面临的三个问题。
二.配置
2.1 vi core-site.xml
<configuration xmlns:xi="http://www.w3.org/2001/XInclude">
<xi:include href="/usr/local/hadoop-3.1.3/etc/hadoop/mountTable.xml" /> # 此处引入federation的额外配置文件
<property>
<!-- 指定hdfs的nameservice名称,在 mountTable.xml 文件中会引用 -->
<name>fs.defaultFS</name>
<value>viewfs://ips/</value>
</property>
<!-- 注意:用了viewfs后tmp.dir配置一定要加file:不然无法识别目录 -->
<property>
<name>hadoop.tmp.dir</name>
<value>file:/hadoop4/tmp</value>
<description>node tmp dir</description>
</property>
</configuration>
2.2 vi mountTable.xml
<?xml version="1.0" encoding="utf-8"?>
<configuration>
<property>
<name>fs.viewfs.mounttable.ips.link./app</name>
<value>hdfs://ns1</value>
</property>
<property>
<name>fs.viewfs.mounttable.ips.link./doc</name>
<value>hdfs://ns2</value>
</property>
</configuration>
2.3 vi hdfs-site.xml
<configuration>
<property>
<name>dfs.nameservices</name>
<value>ns1,ns2</value>
</property>
<!--########ns1########-->
<property>
<name>dfs.ha.namenodes.ns1</name>
<value>nn1,nn2</value>
</property>
<property>
<name>dfs.namenode.rpc-address.ns1.nn1</name>
<value>ipsnode1:8020</value>
</property>
<property>
<name>dfs.namenode.rpc-address.ns1.nn2</name>
<value>ipsnode2:8020</value>
</property>
<property>
<name>dfs.namenode.http-address.ns1.nn1</name>
<value>ipsnode1:50070</value>
</property>
<property>
<name>dfs.namenode.http-address.ns1.nn2</name>
<value>ipsnode2:50070</value>
</property>
<property>
<name>dfs.client.failover.proxy.provider.ns1</name>
<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
</property>
<!--########ns1 end########-->
<!--########ns2########-->
<property>
<name>dfs.ha.namenodes.ns2</name>
<value>nn4,nn3</value>
</property>
<property>
<name>dfs.namenode.rpc-address.ns2.nn4</name>
<value>ipsnode4:8020</value>
</property>
<property>
<name>dfs.namenode.rpc-address.ns2.nn3</name>
<value>ipsnode3:8020</value>
</property>
<property>
<name>dfs.namenode.http-address.ns2.nn4</name>
<value>ipsnode4:50070</value>
</property>
<property>
<name>dfs.namenode.http-address.ns2.nn3</name>
<value>ipsnode3:50070</value>
</property>
<property>
<name>dfs.client.failover.proxy.provider.ns2</name>
<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
</property>
<!--########ns2 end########-->
<!--!!!ns1 must be modifed in diff ns!!!-->
<property>
<name>dfs.namenode.shared.edits.dir</name>
<value>qjournal://ipsnode1:8485;ipsnode2:8485;ipsnode3:8485/ns1</value>
</property>
<property>
<name>dfs.journalnode.edits.dir</name>
<value>/hadoop/log</value>
</property>
<property>
<name>dfs.ha.fencing.methods</name>
<value>
sshfence
shell(/bin/true)
</value>
</property>
<property>
<name>dfs.ha.fencing.ssh.private-key-files</name>
<value>/root/.ssh/id_dsa</value>
</property>
<property>
<name>dfs.ha.automatic-failover.enabled</name>
<value>true</value>
</property>
</configuration>
三.启动
3.1 zkServer.sh start #in all zookeeper node 1,2,3,4
3.2 hdfs --daemon start journalnode #in all journalnodes 1,2,3,4
3.3 hdfs namenode -format -clusterid ipscluster1#in all primary node 1,4
3.4 hdfs --daemon start namenode #in all primary node 1,4
3.5 hdfs namenode -bootstrapStandby #in all standby node 2,3
#hdfs --daemon start namenode #in all primary node 2,3
3.6 hdfs zkfc -formatZK #in all primary node 1,4
3.7 start-dfs.sh #in all primary node 1,4
四.测试
[root@ipsnode1 sbin]# hadoop fs -ls /
Found 2 items
-r-xr-xr-x - root root 0 2019-12-15 16:22 /app
-r-xr-xr-x - root root 0 2019-12-15 16:22 /doc
[root@ipsnode1 sbin]# hadoop fs -ls viewfs://ips/
Found 2 items
-r-xr-xr-x - root root 0 2019-12-15 16:46 viewfs://ips/app
-r-xr-xr-x - root root 0 2019-12-15 16:46 viewfs://ips/doc
[root@ipsnode1 sbin]# hadoop fs -ls hdfs://ns1/
-r-xr-xr-x - root root 0 2019-12-15 16:46 hdfs://ns1/a.txt
[root@ipsnode1 hadoop]# hadoop fs -ls hdfs://ipsnode1:8020/
-r-xr-xr-x - root root 0 2019-12-15 16:46 hdfs://ipsnode1:8020/a.txt