Flink on Yarn

最新推荐文章于 2024-08-19 02:17:51 发布

代码人的自白

最新推荐文章于 2024-08-19 02:17:51 发布

阅读量1.8k

点赞数 1

文章标签： flink

本文链接：https://blog.csdn.net/qq_40990732/article/details/81028619

版权

Flink on Yarn 运行原理

这里写图片描述

第一种：内存集中管理模式

1.启动flink集群
client端需要配置环境变量：
YARN_CONF_DIR
HADOOP_CONF_DIR
HADOOP_HOME
2 ./bin/yaen-session.sh -n 2 -jm 1024 -tm 1024 -d
//-n 2 表示指定两个容器
// -jm 1024 表示jobmanager 1024M内存
// -tm 1024表示taskmanager 1024M内存
//-d 任务后台运行
3. ./bin.yarn-session.sh -id application_1222222_0023 //类似docker容器操作，可以通过web操作，此命令不常用
4. 执行任务
5. ./bin/flink run ./examples/batch/WordCount.jar -input hdfs://hostname:port/LICENSE-2.0.txt -output hdfs://hostname:port/wordcount-result.txt
6. 停止任务

第二种：内存job管理模式

1.启动集群，执行任务
2../bin/flink run -m yarn-cluster -yn 2 -yjm 1024 -ytm 1024 ./examples/bath/WordCount.jar
//-m 指定一个新集群，每次都会启动一个新的集群
// -yn 2 容器个数
// -yjm 1024 表示jobmanager 1024M内存
// -ytm 1024表示taskmanager 1024M内存
//最后跟上jar包

java.lang.RuntimeException:Couldn’t deploy Yarn session cluster

错误原因：虚拟内存超过限制
处理方式：yarn-site.xml中注释以下内容：

<property>
  <name>yarn.nodemanager.vmem-check-enabled</name>
  <value>false</value>
</property>

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

代码人的自白

关注关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Flink on yarn详解

JustinMars的博客

09-27

1114

Flink提供在Yarn上两种运行模式：Session-Cluster和Per-Job-Cluster，其中Session-Cluster的资源在启动集群时就定义完成，后续所有作业的提交都共享该资源，作业可能会互相影响，因此比较适合小规模短时间运行的作业，对于Per-Job-Cluster而言，所有作业的提交都是单独的集群，作业之间的运行不受影响（可能会共享CPU计算资源），因此比较适合大规模长时间运行的作业。

Flink on yarn模式部署

litlit023的专栏

02-02

2939

目录 1. 基于docker部署cdh 2. 遇到的异常 2.1 flink下缺少hadoop相关依赖 2.2 jdk7造成的错误 3. 启动flink on yarn模式 1. 基于docker部署cdh 基于Docker搭建CDH单机单节点集群_litlit023的专栏-CSDN博客 2. 遇到的异常 2.1 flink下缺少hadoop相关依赖基于docker 部署cdn后，启动flink on yarn模式，报了以下错误 ./bin/yarn-session.sh -n

参与评论您还未登录，请先登录后发表或查看评论

Flink on Yarn的两种模式及HA

夏天小厨的博客

03-11

6245

Flink on Yarn模式部署始末：Flink的Standalone和on Yarn模式都属于集群运行模式，但是有很大的不同，在实际环境中，使用Flink on Yarn模式者居多。那么使用on yarn模式到底好在哪呢？首先，在集群运行时，可能会有很多的集群实例包括MapReduce、Spark、Flink等等，那么如果它们全基于on Yarn就可以完成资源分配，减少单个实例集群的维护，提高...

flink on yarn部署

qq_27710549的博客

06-14

2236

flink on yarn部署flink on yarn需要的组件与版本如下Zookeeper 3.4.9 用于做Flink的JobManager的HA服务hadoop 2.7.2 搭建HDFS和Yarnflink 1.3.2 或者 1.4.1版本（scala 2.11）Zookeeper, HDFS 和 Yarn 的组件的安装可以参照网上的教程。在zookeeper，HDFS 和Yarn的组件的...

第二十五节 Docker 部署 Flink on Yarn

最新发布

weixin_40189744的博客

08-19

一、环境系统版本 centos7.6 docker版本 Docker version 20.10.10 准备文件： hadoop-3.3.1.tar.gz #hadoop安装包 hadoopfiles.tar.gz #hadoop内部各种配置文件 jdk1.8.0_201.tar.gz #安装ja...

Flink ON YARN

libaowenBlog的博客

08-20

4085

Flink ON YARN 模式就是使用客户端的方式，直接向Hadoop集群提交任务即可，不需要单独启动Flink进程。

【Flink】【第三章 Flink运行模式】 Flink on Yarn

weixin_43589563的博客

01-11

3670

Yarn模式在yarn模式下，启动flink集群之前要启动yarn和hadoop 以Yarn模式部署Flink任务时，要求Flink有Hadoop支持的版本。Flink1.10要求Hadoop环境需要保证版本在2.2以上，并且集群中安装有HDFS服务。 yarn模式，将flink集群部署在yarn集群上，用yarn的ResourceManager负责flink集群的资源调度。 1.Flink on Yarn的两种模式说明 Flink on yarn有两种运行模式：Session-Cluster和Per

Flink（五十一）—— 一张图轻松掌握 Flink on YARN 基础架构与启动流程

weixin_42073629的博客

10-22

417

Flink 支持 Standalone 独立部署和 YARN、Kubernetes、Mesos 等集群部署模式，其中 YARN 集群部署模式在国内的应用越来越广泛。Flink 社区将推出 Flink on YARN 应用解读系列文章，分为上、下两篇。本文基于 FLIP-6 重构后的资源调度模型将介绍 Flink on YARN 应用启动全流程，并进行详细步骤解析。 Flink on YARN 应用启动流程图 Flink on YARN 集群部署模式涉及 YARN 和 Flink 两大开源框架，应用启动流

Flink On Yarn

weixin_45520075的博客

07-23

767

Yarn模式 Yarn是一个分布式集群资源管理框架，在Yarn集群上可以部署运行各种分布式式应用程序。例如：Mapreduce，Spark。Yarn框架为这些分布式应用程序运行提供了可靠的支持。因为在生产开发环境中很少使用Standalone模式，Flink On Yarn模式用的稍微多一点，今天我们就来讲讲Flink On Yarn 第一种方式在Yarn集群中初始化一个Flink集群，该Flink集群占用着指定的资源，以后提交 ...

【Flink on k8s】- 15 - 将 flink on yarn 迁移到 flink on k8s

欢迎来到我的博客，一起探索代码里的世界！

12-12

707

维护 3 个 HDP 集群使用某云实时计算 Flink。

Flink on Yarn 原理剖析

hhhhhhfq的博客

04-01

2321

本文章将从 Flink 架构、Flink on Yarn 原理及实践、Flink on Kubernetes 原理剖析三部分内容进行介绍。 Flink 架构概览 1、Flink 架构概览 —— Job 用户通过 DataStream API、DataSet API、SQL 和 Table API 编写 Flink 任务，Client 端会生成一个 JobGraph。JobGraph 是由 source、map()、keyBy()/window()/apply() 和 Sink 等算子组成的。当 Jo

hdfs通过接口退出安全模式_flink的yarn模式部署

weixin_39591455的博客

11-26

378

1、yarn cluster 模式部署介绍mr和spark都可以基于yarn模式部署，flink也不例外，生产中很多也基于yarn模式部署。flink的yarn模式部署也分为两种方式，一种是yarn-session，一种是yarn-per-job。大致如下图：2、flink session HA模式需要先启动集群，然后在提交作业，接着会向yarn申请一块资源空间后，资源永远保持不变。如果资源满了，...

flink on yarn集群部署模式

m0_73814022的博客

01-17

1309

介绍YARN 上部署的过程是：客户端把 Flink 应用提交给 Yarn 的ResourceManager, Yarn 的 ResourceManager 会向 Yarn 的 NodeManager 申请容器。在这些容器上，Flink 会部署JobManager 和 TaskManager 的实例，从而启动集群。Flink 会根据运行在 JobManger 上的作业所需要的 Slot 数量动态分配TaskManager 资源。集群部署模式分为1.会话模式2.单作业模式3.应用模式。

Flink on Yarn的两种模式