日志
Caused by: java.lang.RuntimeException: org.apache.hadoop.ipc.RemoteException(org.apache.hadoop.ipc.StandbyException): Operation category READ is not supported in state standby. Visit https://s.apache.org/sbnn-error
at org.apache.hadoop.hdfs.server.namenode.ha.StandbyState.checkOperation(StandbyState.java:88)
at org.apache.hadoop.hdfs.server.namenode.NameNode$NameNodeHAContext.checkOperation(NameNode.java:1952)
at org.apache.hadoop.hdfs.server.namenode.FSNamesystem.checkOperation(FSNamesystem.java:1423)
at org.apache.hadoop.hdfs.server.namenode.FSNamesystem.getFileInfo(FSNamesystem.java:3085)
at org.apache.hadoop.hdfs.server.namenode.NameNodeRpcServer.getFileInfo(NameNodeRpcServer.java:1154)
at org.apache.hadoop.hdfs.protocolPB.ClientNamenodeProtocolServerSideTranslatorPB.getFileInfo(ClientNamenodeProtocolServerSideTranslatorPB.java:966)
at org.apache.hadoop.hdfs.protocol.proto.ClientNamenodeProtocolProtos$ClientNamenodeProtocol$2.callBlockingMethod(ClientNamenodeProtocolProtos.java)
at org.apache.hadoop.ipc.ProtobufRpcEngine$Server$ProtoBufRpcInvoker.call(ProtobufRpcEngine.java:523)
at org.apache.hadoop.ipc.RPC$Server.call(RPC.java:991)
at org.apache.hadoop.ipc.Server$RpcCall.run(Server.java:872)
at org.apache.hadoop.ipc.Server$RpcCall.run(Server.java:818)
at java.security.AccessController.doPrivileged(Native Method)
at javax.security.auth.Subject.doAs(Subject.java:422)
at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1729)
at org.apache.hadoop.ipc.Server$Handler.run(Server.java:2678)
原因
在Hadoop HA集群中,一般有两个NameNode(NN),一个是Active的ANN,另一个是Standby的SBNN。 只有ANN对外提供读写功能,那么当客户端想要对文件系统元数据进行修改操作时,比如创建文件,删除文件,重命名文件等,客户端必须连接ANN。而且当ANN负载过高时会转移到负载低的SBNN,此时ANN就换了ip地址了,因此我们不能把ANN写死。
解决
修改hdfs-site.xml文件
<property>
<name>dfs.client.failover.proxy.provider.Test-hr-bigdata</name>
<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
</property>
<property>
<name>dfs.ha.automatic-failover.enabled</name>
<value>true</value>
</property>
这个属性Hadoop提供了两种自带的实现:ConfiguredFailoverProxyProvider 和RequestHedgingProxyProvider
ConfiguredFailoverProxyProvider :
顾名思义就是按照配置文件的方式去找ANN
<property>
<name>dfs.ha.namenodes.Test-hr-bigdata</name>
<value>nn1,nn2</value>
</property>
<property>
<name>dfs.namenode.rpc-address.Test-hr-bigdata.nn1</name>
<value>hadooptest01:8020</value>
</property>
<property>
<name>dfs.namenode.rpc-address.Test-hr-bigdata.nn2</name>
<value>hadooptest02:8020</value>
</property>
<property>
<name>dfs.namenode.http-address.Test-hr-bigdata.nn1</name>
<value>hadooptest01:50070</value>
</property>
<property>
<name>dfs.namenode.http-address.Test-hr-bigdata.nn2</name>
<value>hadooptest02:50070</value>
</property>
RequestHedgingProxyProvider :
如果采用这种方式的话,首先会并发的向每个NN发送请求来判定哪个是ANN,然后接下来的请求就直接向ANN发送请求。
注意:Test-hr-bigdata要和core-site.xml保持一致
<property>
<name>fs.default.name</name>
<value>hdfs://Test-hr-bigdata</value>
</property>
<property>
<name>fs.defaultFS</name>
<value>hdfs://Test-hr-bigdata</value>
</property>
<property>
<name>dfs.nameservices</name>
<value>Test-hr-bigdata</value>
</property>
在所有节点中添加属性后,重新启动 Namenodes 和 HttpFs。