Flink运行在yarn上

最新推荐文章于 2024-07-24 11:58:44 发布

diaojing1918

最新推荐文章于 2024-07-24 11:58:44 发布

阅读量751

点赞数

文章标签：大数据 java 开发工具

原文链接：http://www.cnblogs.com/niutao/p/10548340.html

版权

本文详细介绍了如何在YARN上配置和运行Flink，包括修改Hadoop配置参数、设置环境变量以及通过YARN-session.sh启动和提交Flink任务。文章讨论了两种启动Flink作业的方式，一种是启动YARN会话，另一种是直接在YARN上提交作业，并提供了停止任务的方法。

摘要由CSDN通过智能技术生成

在一个企业中，为了最大化的利用集群资源，一般都会在一个集群中同时运行多种类型的 Workload。因此 Flink 也支持在 Yarn 上面运行；

flink on yarn的前提是：hdfs、yarn均启动

修改hadoop的配置参数

vim etc/hadoop/yarn-site.xml

 <property>             
      <name>yarn.nodemanager.vmem-check-enabled</name>            
      <value>false</value>   
</property>

是否启动一个线程检查每个任务正使用的虚拟内存量，如果任务超出分配值，则直接将其杀掉，默认是true。

在这里面我们需要关闭，因为对于flink使用yarn模式下，很容易内存超标，这个时候yarn会自动杀掉job

修改全局变量/etc/profile

vim /etc/profile

export HADOOP_CONF_DIR=/opt/cdh/hadoop/etc/Hadoop

YARN_CONF_DIR或者HADOOP_CONF_DIR必须将环境变量设置为读取YARN和HDFS配置

使用flink on yarn提交任务

在YARN上启动一个Flink主要有两种方式：

(1)、启动一个YARN session(Start a long-running Flink cluster on YARN)；

(2)、直接在YARN上提交运行Flink作业(Run a Flink job on YARN)

这种模式下会启动yarn session，并且会启动Flink

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

diaojing1918

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

【Flink】Flink 运行到yarn 队列资源不足，导致无法运行

九师兄

03-23

295

后面突然想到以前遇到的问题，我们提交的任务队列被占满了，导致我们的任务一直提交不上去，界面上看着是running状态，实际上还没有运行呢？然后看看flink监控，发现监控室空白的，流计算正常，数据有lag，日志里面没有报错，但是就是不消费了界面这里也不显示速度等。然后现场决定把所有的别人的任务都干掉，这个本来就是给我们用的，他们却偷偷的用。这个命令可以看到我们运行的队列是哪个，但是发现有别人跟我们运行的队列一样。杀掉所有任务后，发现队列果然空了，然后我们启动我们的任务，启动后我们的果然都有数据了。

Apache Flink连载（十九）：Flink On Yarn运行-Yarn Session模式

qq_32020645的博客

12-28

1351

🏡 个人主页：IT贫道_大数据OLAP体系技术栈,Apache Doris,Clickhouse 技术-CSDN博客🚩 私聊博主：加入大数据技术讨论群聊，获取更多大数据资料。🔔 博主个人B栈地址：豹哥教你大数据的个人空间-豹哥教你大数据个人主页-哔哩哔哩视频。

参与评论您还未登录，请先登录后发表或查看评论

把Flink任务运行在yarn上

zg_hover的专栏

09-29

2607

把Flink应用运行在yarn上本文讲述如何在yarn集群上部署和运行flink应用。部署图 flink支持在yarn集群上行运行，通过yarn来分配资源。如图1所示，flink on yarn的模式和spark on yarn模式相似。在运行flink应用前，必须要先安装并运行hadoop+yarn集群。而flink应用部署在一台能够和hadoop(yarn)集群联通的客户机上。图1 Flink on Yarn部署图配置Flink应用运行环境配置配置hadoop和yarn客户端环境下载安

flink 在yarn 上的运行

zeng6325998的博客

07-28

1282

参考资料 https://ci.apache.org/projects/flink/flink-docs-stable/ops/deployment/yarn_setup.html https://www.jianshu.com/p/1b05202c4fb6 （非常的详细） flink在yarn上运行的模式目前基于的版本是1.11.1 前置条件 hadoop版本最少为2.4.1 flink在yarn上有2种模式 1、Flink YARN Session 2、Run a single Flink .

Flink -3- 一文详解安装部署以及使用和调优（standalone 模式 | yarn 模式）

最新发布

苍煜

07-24

3003

Yarn Application 与Per-Job 模式类似，只是提交任务不需要客户端进行提交，直接由JobManager来进行任务提交，每个Flink Application对应一个Flink集群，如果该Flink Application有多个job任务，所有job任务共享该集群资源，TaskManager也是根据提交的Application所需资源情况动态进行申请。Flink可以基于Yarn来运行任务，Yarn作为资源提供方，可以根据Flink任务资源需求动态的启动TaskManager来提供资源。

【Flink】YARN运行模式

qq_43744420的博客

08-12

814

【Flink】Flink部署YARN运行

hdfs通过接口退出安全模式_flink的yarn模式部署

weixin_39591455的博客

11-26

371

1、yarn cluster 模式部署介绍mr和spark都可以基于yarn模式部署，flink也不例外，生产中很多也基于yarn模式部署。flink的yarn模式部署也分为两种方式，一种是yarn-session，一种是yarn-per-job。大致如下图：2、flink session HA模式需要先启动集群，然后在提交作业，接着会向yarn申请一块资源空间后，资源永远保持不变。如果资源满了，...

基于 YARN 模式部署 Flink 服务

小特工的专栏

01-28

2308

Flink-Session 方式下面将对图1-1 所示内容进行阐述。准备资源发现配置想要让 Flink 服务运行与 YARN 之上，首先需要让 Flink 能够发现 YARN 和 HDFS 的相关配置，因此，需要通过 YARN_CONF_DIR、HADOOP_CONF_DIR、HADOOP_CONF_PATH 属性来指定 Hadoop 配置文件所在目录。提示：上述 3 个属性，指定其中之一即可，如果全部指定，将按照指定顺序加载。习惯上，常用 HADOOP_CONF_D

【Flink】【第三章 Flink运行模式】 Flink on Yarn

weixin_43589563的博客

01-11

3635

Yarn模式在yarn模式下，启动flink集群之前要启动yarn和hadoop 以Yarn模式部署Flink任务时，要求Flink有Hadoop支持的版本。Flink1.10要求Hadoop环境需要保证版本在2.2以上，并且集群中安装有HDFS服务。 yarn模式，将flink集群部署在yarn集群上，用yarn的ResourceManager负责flink集群的资源调度。 1.Flink on Yarn的两种模式说明 Flink on yarn有两种运行模式：Session-Cluster和Per

Apache Flink连载（二十一）：Flink On Yarn运行原理-Yarn Application模式

qq_32020645的博客

12-30

956

在YARN上使用Flink有3种模式：Per-Job模式、Session模式和Application模式-1。job的轻巧提交设置

CarloPan的博客

06-12

1万+

https://weread.qq.com/web/reader/1b932790723982d91b9bd8dk66f3299023a66f041e16858

Flink on Yarn的两种运行方式

Jiny_li的博客

01-06

5186

Flink on Yarn的两种运行方式第一种【yarn-session.sh(开辟资源)+flink run(提交任务)】 •启动一个一直运行的flink集群 •./bin/yarn-session.sh -n 2 -jm 1024 -tm 1024 [-d] •附着到一个已存在的flink yarn session •./bin/yarn-session.sh -id applic...

【Flink】SQL-Client运行yarn-session模式

lsr40的博客

02-01

8581

flink有个sql-client.sh （如下的图，是从flink官网截图下来的）官网地址：https://ci.apache.org/projects/flink/flink-docs-release-1.11/dev/table/sqlClient.html 具体如何配置sql-client和各种框架集成，我就不搞了，大家有兴趣研究下官网或者百度下，我就试了下集成hive 具体如何配置，请看以下文章！ flink 1.11.2-sql-client 集成hive：htt..

flink sql-client.sh 提交到yarn

xiaosannimei的博客

12-25

3876

下载flink安装包解压 cd 到安装目录执行一下命令启动集群 ./bin/start-cluster.sh 之后执行启动sql-client命令： ./bin/sql-client.sh embedded 默认情况下，这个sql-client上面所跑的任务，会提交到flink的standalone集群上，如果你没有bin/start-cluster.sh启动standalon集群，那么sql-client进程可以启动起来，但是在实际执行sql的时候，会连接拒绝的错误。如果想.

Flink安装与运行——flink on yarn

雾幻的博客

01-22

1万+

Flink下载地址：https://flink.apache.org/downloads.html 因目前Flink尚未集成hadoop2.9版本，因此选择2.7稳定版进行安装（兼容）以下操作请在集群的所有节点进行解压重命名 $ tar -zxvf flink-1.7.1-bin-hadoop27-scala_2.11.tgz /opt/beh/core $ mv flink-1.7.1...

Flink读取Kafka数据保存到Redis的解决方案教程

08-28

大数据发展史：Flink和storm sparkstreaming对比实时框架如何选择1：需要关注流数据是否需要进行状态管理 2：At-least-once或者Exectly-once消息投递模式是否有特殊要求 3：对于小型独立的项目，并且需要低延迟的场景，建议使用storm 4：如果你的项目已经使用了spark，并且秒级别的实时处理可以满足需求的话，建议使用sparkStreaming5：要求消息投递语义为 Exactly Once 的场景；数据量较大，要求高吞吐低延迟的场景；需要进行状态管理或窗口统计的场景，建议使用flink针对以上知识我们通过flink读取kafka保存到redis方式快速让大家学习flink如何使用，以及我们如果搭建高性能的flink应用，这个课程属于快速实战篇。Flink + kafka + redis 实时计算

Flink在Yarn模式部署和命令

weixin_40659514的博客

10-25

3200

flink的yarn提交模式

Flink提交任务至yarn