Flink on yarn 高可用环境配置 high-availability

最新推荐文章于 2024-05-17 10:33:48 发布

云想慕尘

最新推荐文章于 2024-05-17 10:33:48 发布

阅读量1.2k

点赞数 3

分类专栏： Flink 大数据文章标签： flink 大数据

本文链接：https://blog.csdn.net/cndotaci/article/details/106870413

版权

1. 背景

默认情况下一个flink job只启动一个jobManager，因此存在单点故障问题，所以生产环境中需要HA。
因为生产环境中基于yarn集群的flink应用场景更多，本文只介绍基于yarn的flink高可用配置。

2. 配置

配置yarn集群级别AM重启上限

# vim yarn-site.xml

<property>
  <name>yarn.resourcemanager.am.max-attempts</name>
  <value>100</value>
</property>

配置flink HA相关

# vim /home/admin/flink-1.9.1/conf/flink-conf.yaml

high-availability: zookeeper
high-availability.storageDir: hdfs:///flink/ha/
high-availability.zookeeper.quorum: uhadoop-op3raf-master1,uhadoop-op3raf-master2,uhadoop-op3raf-core1
# 单个flink job的重试次数
yarn.application-attempts: 10

3. 启动

方式一

启动一个基于yarn的flink集群

/home/admin/flink-1.9.1/bin/yarn-session.sh -n 10 -jm 10g -tm 10g -s 10 2>&1 &

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

云想慕尘

关注关注

3
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Flink系列：flink on yarn高可用配置

NIO4444

07-17

651

目录修改xml 配置conf 启动HA 修改xml 配置conf 启动HA

Flink中三种模式：YARN Session 模式、YARN Per-Job 模式和 YARN Application 模式提交任务命令

最新发布

JustinMars的博客

07-30

357

在 Apache Flink 中，YARN 提供了多种模式来提交和管理作业，每种模式都有其独特的特点和适用场景。主要有以下三种模式：YARN Session 模式、YARN Per-Job 模式和 YARN Application 模式。

参与评论您还未登录，请先登录后发表或查看评论

高可用Flink on YARN集群快速配置

云祁QI

11-09

758

我们长久以来一直使用Spark作为离线和近实时计算框架，几乎承担了主要业务中所有的计算任务。最近Flink逐渐兴起，我们通过查阅资料和参加Meetup，了解到Flink在实时计算方面确实比Spark有优势。我们正准备涉足实时业务，实时数仓、实时推荐这些东西总是要有的，快速上手Flink势在必行。 Flink的官方文档比较详尽，并且设计理念与Spark多有相通，理解成本较低。Flink有多种集群部署方式（Local/Standalone/YARN/K8s/Mesos等等），考虑到已经有现成的YARN和Zoo

Flink 高可用之On Yarn 高可用方案（二）

天道酬勤

05-17

227

先在yarn启动一个flink集群，然后将任务提交到这个集群上，这种模式，集群中的任务使用相同的资源，如果某一个任务出现了问题导致整个集群挂掉，那就得重启集群中的所有任务，这样就会给集群造成很大的负面影响。考虑到集群的资源隔离情况，一般生产上的任务都会选择per job模式，也就是每个任务启动一个flink集群，各个集群之间独立运行，互不影响,且每个集群可以设置独立的配置。2 .parallelism是动态的概念，是指程序运行时实际使用的并发能力。Flink 高可用之On Yarn 高可用方案（二）

Flink Yarn 模式高可用性配置

我是小坏

02-20

3152

Flink 版本1.7.2 目录 YARN群集高可用性配置：在运行高可用性YARN群集时，我们不会运行多个JobManager（ApplicationMaster）实例，而只会运行一个，由YARN在失败时重新启动。确切的行为取决于您使用的特定YARN版本。配置：最大 Application Master 尝试数量 (yarn-site.xml) 您必须配置为尝试appl...

flink on yarn 高可用部署

Andrew_2018的博客

05-02

1045

Flink-conf.yaml high-availability: zookeeper high-availability.zookeeper.quorum: localhost:2181 high-availability.storageDir: hdfs:///flink/recovery high-availability.zookeeper.path.root: /flink ...

flink 高可用 high-availability 配置的重试次数无效问题

云想慕尘的专栏

07-02

2912

问题背景我根据这篇博客https://blog.csdn.net/cndotaci/article/details/106870413的介绍，配置了flink基于yarn的高可用，测试时发现配置的任务失败重试2次没有生效，我测试到第6次时，任务仍然能够被yarn拉起如上图，除第一次手动启动外，下面的5次都是yarn的HA生效自动拉起。那么，下面配置中的重试次数为什么没有生效？ flink版本：1.10.0 flink-conf.yaml配置： $ grep -v ^# flink-conf.yaml

flink on yarn 中的flink-conf.yaml参数

JustinMars的博客

07-19

1569

Flink TaskManager 的堆内存的百分比，小于此比例则 Flink 会在 YARN 上启动一个附加的非堆外存储容器。修改配置后，请确保将修改后的。: 如果 Flink TaskManager 的堆内存小于此值，则 Flink 会在 YARN 上启动一个附加的非堆外存储容器。是 Flink 配置文件，用于配置 Flink 应用程序在 YARN 上的运行。: 指定每个 TaskManager 的内存大小，用于 Flink 操作和状态。文件中的参数，你可以调整 Flink 集群的行为和性能。

生产环境中的 Flink 高可用配置

weixin_42642502的博客

06-06

635

源码分析 Flink 中的 JobManager、WebServer 等组件都需要高可用保障，并且 Flink 还需要进行 Checkpoint 元数据的持久化操作。与 Flink HA 相关的类图如下图所示，我们跟随源码简单看一下 Flink HA 的实现。 HighAvailabilityMode 类中定义了三种高可用性模式枚举， NONE：非 HA 模式 ZOOKEEPER：基于 ZK 实现 HA FACTORY_CLASS：自定义 HA 工厂类，该类需要实现 HighAvailabilitySe

Flink V1.6.1高可用配置指南

02-24

Flink V1.6.1高可用配置指南，包括Flink Standalone 集群HA配置和Flink on yarn 集群HA配置。

flink的高可用配置ha-conf

09-28

flink高可用配置，flink 各项配置文件模板，flink-conf.yaml 重点是状态后端配置，基于flink1.11版本

Flink on Yarn （HA）高可用部署基于flink1.12 CDH5.8.5 保姆级操作

weixin_52918377的博客

04-20

1470

Flink on Yarn -CDH5部署 1.1 Flink模式 Flink有开发模式，Local-cluster模式，Standalone模式，Yarn模式这里我们搭建在CDH集群上，我们采Flink on Yarn，由Yarn统一管理集群资源 1.2 Yarn模式部署独立部署（Standalone）模式由Flink自身提供计算资源，无需其他框架提供资源，这种方式降低了和其他第三方资源框架的耦合性，独立性非常强。但是Flink主要是计算框架，而不是资源调度框架，所以本身提供的资源调度

基于Yarn搭建Flink

幽灵逐梦--专栏

05-31

2017

基于Yarn搭建Flink

基于 YARN 模式部署 Flink 服务

小特工的专栏

01-28

2310

Flink-Session 方式下面将对图1-1 所示内容进行阐述。准备资源发现配置想要让 Flink 服务运行与 YARN 之上，首先需要让 Flink 能够发现 YARN 和 HDFS 的相关配置，因此，需要通过 YARN_CONF_DIR、HADOOP_CONF_DIR、HADOOP_CONF_PATH 属性来指定 Hadoop 配置文件所在目录。提示：上述 3 个属性，指定其中之一即可，如果全部指定，将按照指定顺序加载。习惯上，常用 HADOOP_CONF_D

flink on yarn集群环境(生产环境使用)

cqscf的博客

04-18

3827

flink on yarn集群环境(生产环境使用)

大数据实操篇 No.11-Flink on Yarn集群HA高可用部署及使用

pezynd的专栏

09-05

4635

第1章简介 Flink on Yarn的HA高可用模式，首先依赖于yarn自身的高可用机制（ResourceManager高可用），并通过yarn对jobmanager进行管理，当jobmanager失效时，yarn将重新启动jobmanager。其次flink job在恢复时，需要依赖checkpoint进行恢复，而checkpoint的快照依赖于hdfs的高可用，同时jobmanager的元数据信息也依赖于hdfs的高可用（namenode的高可用，和多副本机制），再者jobmanager元数据的指

Flink v1.6.1 《Yarn 模式 高可用分布式集群部署》

Mathieu66的博客

11-01

547

目录 1. Flink下载 2. 环境准备 2.1 软件要求 2.2 集群部署规划 3. 解压安装 3.1 解压安装包 3.2 修改配置文件 3.3 发送到其他节点 3.4 配置环境变量 4. 启动 5. 参考 Flink高可用集群分为Standalone HA 和 YARN Cluster HA，这里只介绍 YARN Cluster HA。 1. Flink下载安装...

flink on yarn环境变量配置

09-20

4. 配置flink on yarn相关参数：在flink的conf目录下，修改flink-conf.yaml配置文件，设置以下参数： - 设置execution.mode为yarn-cluster。 - 设置yarn.application.name为flink-on-yarn。 - 设置yarn....