Spark之Caused by: Operation category READ is not supported in state standby

南风知我意丿

已于 2022-10-08 18:30:26 修改

阅读量815

点赞数

分类专栏： Spark 文章标签： spark hadoop 大数据

于 2022-10-08 18:29:01 首次发布

本文链接：https://blog.csdn.net/Lzx116/article/details/127213705

版权

Spark 专栏收录该内容

57 篇文章 2 订阅

订阅专栏

文章目录

日志
原因
解决
源码解析参考

日志

Caused by: java.lang.RuntimeException: org.apache.hadoop.ipc.RemoteException(org.apache.hadoop.ipc.StandbyException): Operation category READ is not supported in state standby. Visit https://s.apache.org/sbnn-error
	at org.apache.hadoop.hdfs.server.namenode.ha.StandbyState.checkOperation(StandbyState.java:88)
	at org.apache.hadoop.hdfs.server.namenode.NameNode$NameNodeHAContext.checkOperation(NameNode.java:1952)
	at org.apache.hadoop.hdfs.server.namenode.FSNamesystem.checkOperation(FSNamesystem.java:1423)
	at org.apache.hadoop.hdfs.server.namenode.FSNamesystem.getFileInfo(FSNamesystem.java:3085)
	at org.apache.hadoop.hdfs.server.namenode.NameNodeRpcServer.getFileInfo(NameNodeRpcServer.java:1154)
	at org.apache.hadoop.hdfs.protocolPB.ClientNamenodeProtocolServerSideTranslatorPB.getFileInfo(ClientNamenodeProtocolServerSideTranslatorPB.java:966)
	at org.apache.hadoop.hdfs.protocol.proto.ClientNamenodeProtocolProtos$ClientNamenodeProtocol$2.callBlockingMethod(ClientNamenodeProtocolProtos.java)
	at org.apache.hadoop.ipc.ProtobufRpcEngine$Server$ProtoBufRpcInvoker.call(ProtobufRpcEngine.java:523)
	at org.apache.hadoop.ipc.RPC$Server.call(RPC.java:991)
	at org.apache.hadoop.ipc.Server$RpcCall.run(Server.java:872)
	at org.apache.hadoop.ipc.Server$RpcCall.run(Server.java:818)
	at java.security.AccessController.doPrivileged(Native Method)
	at javax.security.auth.Subject.doAs(Subject.java:422)
	at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1729)
	at org.apache.hadoop.ipc.Server$Handler.run(Server.java:2678)

原因

在Hadoop HA集群中，一般有两个NameNode（NN），一个是Active的ANN，另一个是Standby的SBNN。只有ANN对外提供读写功能，那么当客户端想要对文件系统元数据进行修改操作时，比如创建文件，删除文件，重命名文件等，客户端必须连接ANN。而且当ANN负载过高时会转移到负载低的SBNN，此时ANN就换了ip地址了，因此我们不能把ANN写死。

解决

修改hdfs-site.xml文件

<property>
        <name>dfs.client.failover.proxy.provider.Test-hr-bigdata</name>
        <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
</property>

<property>
  <name>dfs.ha.automatic-failover.enabled</name>
  <value>true</value>
</property>

这个属性Hadoop提供了两种自带的实现：ConfiguredFailoverProxyProvider 和RequestHedgingProxyProvider
ConfiguredFailoverProxyProvider ：
顾名思义就是按照配置文件的方式去找ANN

<property>
     <name>dfs.ha.namenodes.Test-hr-bigdata</name>
     <value>nn1,nn2</value>
 </property>
 <property>
     <name>dfs.namenode.rpc-address.Test-hr-bigdata.nn1</name>
     <value>hadooptest01:8020</value>
 </property>
 <property>
     <name>dfs.namenode.rpc-address.Test-hr-bigdata.nn2</name>
     <value>hadooptest02:8020</value>
 </property>
 <property>
     <name>dfs.namenode.http-address.Test-hr-bigdata.nn1</name>
     <value>hadooptest01:50070</value>
 </property>
 <property>
     <name>dfs.namenode.http-address.Test-hr-bigdata.nn2</name>
     <value>hadooptest02:50070</value>
 </property>

RequestHedgingProxyProvider ：
如果采用这种方式的话，首先会并发的向每个NN发送请求来判定哪个是ANN，然后接下来的请求就直接向ANN发送请求。

注意：Test-hr-bigdata要和core-site.xml保持一致

	<property>
		<name>fs.default.name</name>
		<value>hdfs://Test-hr-bigdata</value>
	</property>
	<property>
		<name>fs.defaultFS</name>
		<value>hdfs://Test-hr-bigdata</value>
	</property>
	<property>
		<name>dfs.nameservices</name>
		<value>Test-hr-bigdata</value>
	</property>

在所有节点中添加属性后，重新启动 Namenodes 和 HttpFs。

源码解析参考

DFSClient怎么找到Active Namenode

南风知我意丿

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Spark之Caused by: Operation category READ is not supported in state standby

Caused by: Operation category READ is not supported in state standby
复制链接

扫一扫