文章目录
前言
将Flink 提交在 YARN 上是企业的一种常用做法,这样做的目的是为了提高集群的利用率。
Flink on YARN 有2种部署方式
-
【yarn-session.sh开辟资源+ flink run】(这样的话,Flink cluster 会常驻)
-
【flink run -m yarn-cluster(开辟资源+提交任务】 (每次提交,都会创建一个新的Flink 集群,任务之间相互独立)
此文旨在阐述,Flink 提交 YARN 的过程。
Flink on YARN
YARN中一些重要的概念
ResourceManager
- 每个集群只会有一个ResourceManager(如果是HA的话会存在两个,但是有且只有一个处于active状态),它负责管理整个集群的计算资源,并将这些资源分别给应用程序。ResourceManager 内部主要有两个组件:
- Scheduler:这个组件完全是插拔式的,用户可以根据自己的需求实现不同的调度器,目前YARN提供了FIFO、容量以及公平调度器。这个组件的唯一功能就是给提交到集群的应用程序分配资源,并且对可用的资源和运行的队列进行限制。Scheduler并不对作业进行监控&#