flink jobmanager 启动失败,报错:taskexecutor.TaskExecutor-Could not resolve ResourceManager address

背景

最近在部署flink集群,jobmanager的 8081 端口可以访问,但是 task managers 这里什么都没有显示,估计是 启动失败。
在这里插入图片描述

在task manager的服务器上翻日志,可以找到一些有用的信息:

2023-01-18 16:32:46: 2023-01-18 16:32:46,317 WARN akka.remote.transport.netty.NettyTransport [] - Remote connection to [null] failed with java.net.ConnectException: Connection refused: taskmanager/xxxx:6123
2023-01-18 16:32:46: 2023-01-18 16:32:46,318 WARN akka.remote.ReliableDeliverySupervisor [] - Association with remote system [akka.tcp://flink@taskmanager:6123] has failed, address is now gated for [50] ms. Reason: [Association failed with [akka.tcp://flink@taskmanager:6123]] Caused by: [java.net.ConnectException: Connection refused: taskmanager/xxxx:6123]
2023-01-18 16:32:46: 2023-01-18 16:32:46,320 INFO org.apache.flink.runtime.taskexecutor.TaskExecutor [] - Could not resolve ResourceManager address akka.tcp://flink@taskmanager:6123/user/rpc/resourcemanager_*, retrying in 10000 ms: Could not connect to rpc endpoint under address akka.tcp://flink@taskmanager:6123/user/rpc/resourcemanager_*.

应该是 taskmanager 的配置出了问题。

解决办法

1、首先检查配置:
flink-conf.yaml 文件

jobmanager.rpc.address: jobmanager Ip
确保这里配置的是 jobmanager 对应的 ip 或者 主机名。

如果还是报错,添加如下配置:

taskmanager.host: localhost

2、
以上两个是网上比较常用的建议。可是问题并没有解决,报错的内容还是一样的,而jobmanager 并没有报错。
由此想到 taskmanager的 jobmanager.rpc.address 配置并不是来自于 flink-conf.yaml。我的部署方式是通过docker来进行的,最终的解决办法是在docker-compose.yml中进行配置。

environment:
FLINK_PROPERTIES: |-
jobmanager.rpc.address: xxxx

至此,问题解决。

ps:taskmanager.numberOfTaskSlots 也是通过 docker-compose.yml 进行配置的

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值