一、问题场景
提交yarn执行时连接ResourceManager无限重试
二、原因分析
1.登录到ResourceManager所在的节点,首先用jps命令检查ResourceManager是否已启动。已启动
2.检查系统防火墙是否已关闭。已关闭
3.检查ResourceManager服务端口8032是否正常监听
netstat -nltp | grep java
# 或者netstat -nltp | grep 8032
发现服务使用的网卡ip为回环地址127.0.1.1,只能接收到来自本机的数据包,导致了其它节点无法访问ResourceManager
检查yarn-site.xml中ResourceManager服务地址
<!-- 指定 ResourceManager 的地址-->
<property>
<name>yarn.resourcemanager.hostname</name>
<value>k8s-bk-3</value>
</property>
发现/etc/hosts中有一条映射
因此resourcemanager的ip通过hosts直接被解析为了127.0.1.1,最终导致了此问题
三、解决方案
将/etc/hosts中这条映射注释掉,重启yarn即可