flink 高可用 high-availability 配置的重试次数无效问题

云想慕尘

已于 2022-11-04 14:10:32 修改

阅读量2.9k

点赞数

于 2020-07-02 07:46:44 首次发布

本文链接：https://blog.csdn.net/cndotaci/article/details/107076252

版权

问题背景

我根据这篇博客https://blog.csdn.net/cndotaci/article/details/106870413的介绍，配置了flink基于yarn的高可用，测试时发现配置的任务失败重试2次没有生效，我测试到第6次时，任务仍然能够被yarn拉起

在这里插入图片描述

如上图，除第一次手动启动外，下面的5次都是yarn的HA生效自动拉起。

那么，下面配置中的重试次数为什么没有生效？

flink版本：1.10.0

flink-conf.yaml配置：

$ grep -v ^# flink-conf.yaml |grep -v ^$
jobmanager.rpc.address: localhost
jobmanager.rpc.port: 6123
jobmanager.heap.size: 1024m
taskmanager.memory.process.size: 1568m
taskmanager.numberOfTaskSlots: 1
parallelism.default: 1
high-availability: zookeeper
high-availability.storageDir: hdfs:///flink/ha/
high-availability.zookeeper.quorum: hadoop-cluster-master1,hadoop-cluster-master2,hadoop-cluster-core1
state.checkpoints.dir: hdfs:///flink/checkpoint
state.savepoints.dir: hdfs:///flink/flink-savepoin