yarn ha 2个集群共用一个zookeeper遇到的问题

问题描述:
2个yarn集群,都做了ha,都是使用了同一个zookeeper集群,集群名称不一样,运行几天后,发现每天定时yarn切换了master节点,日志里发现报错如下:

2020-01-12 18:41:26,831 ERROR org.apache.hadoop.yarn.server.resourcemanager.recovery.RMStateStore: Error While Removing RMDTMasterKey.
org.apache.zookeeper.KeeperException$NoAuthException: KeeperErrorCode = NoAuth
        at org.apache.zookeeper.KeeperException.create(KeeperException.java:116)
        at org.apache.zookeeper.ZooKeeper.multiInternal(ZooKeeper.java:1015)
        at org.apache.zookeeper.ZooKeeper.multi(ZooKeeper.java:919)
        at org.apache.curator.framework.imps.CuratorTransactionImpl.doOperation(CuratorTransactionImpl.java:159)
        at org.apache.curator.framework.imps.CuratorTransactionImpl.access$200(CuratorTransactionImpl.java:44)
        at org.apache.curator.framework.imps.CuratorTransactionImpl$2.call(CuratorTransactionImpl.java:129)
        at org.apache.curator.framework.imps.CuratorTransactionImpl$2.call(CuratorTransactionImpl.java:125)
        at org.apache.curator.RetryLoop.callWithRetry(RetryLoop.java:109)

经过分析,问题原因是yarn ha的默认参数里存zk的地址是/rmstore,如果2个集群共用一个zk,master key默认过期时间是86400秒,就会出现每天更换master key之后,2个集群改写同一个key,导致失效,引起yarn自动恢复重启。

解决办法:
每个集群配置单独的zk store目录:

<property>
	<name>yarn.resourcemanager.zk-state-store.parent-path</name>
	<value>/yarncluster1</value>
</property>
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值