Flink （四） Flink 的安装和部署- Flink on Yarn 模式 / 集群HA / 并行度和Slot

最新推荐文章于 2024-07-24 11:58:44 发布

plenilune-望月

最新推荐文章于 2024-07-24 11:58:44 发布

阅读量2k

点赞数

分类专栏： Flink实时计算引擎

本文链接：https://blog.csdn.net/donglinjob/article/details/113339473

版权

Flink实时计算引擎专栏收录该内容

4 篇文章 1 订阅

订阅专栏

接上一篇 Flink （三） Flink 的安装和部署- -Standalone模式

3. Flink 提交到 Yarn

Flink on Yarn 模式的原理是依靠 YARN 来调度 Flink 任务，目前在企业中使用较多。这种模式的好处是可以充分利用集群资源，提高集群机器的利用率，并且只需要 1 套 Hadoop集群，就可以执行 MapReduce 和 Spark 任务，还可以执行 Flink 任务等，操作非常方便，不需要维护多套集群，运维方面也很轻松。Flink on Yarn 模式需要依赖 Hadoop 集群，并且Hadoop 的版本需要是 2.2 及以上。我们的课程里面选择的 Hadoop 版本是 2.7.2。

Flink On Yarn 的内部实现原理：

a、当启动一个新的 Flink YARN Client 会话时，客户端首先会检查所请求的资源（容器和内存）是否可用。之后，它会上传 Flink 配置和 JAR 文件到 HDFS。

b、客户端的下一步是请求一个 YARN 容器启动 ApplicationMaster 。 JobManager 和ApplicationMaster(AM)运行在同一个容器中，一旦它们成功地启动了，AM 就能够知道
JobManager 的地址，它会为 TaskManager 生成一个新的 Flink 配置文件（这样它才能连上 JobManager），该文件也同样会被上传到 HDFS。另外，AM 容器还提供了 Flink 的Web 界面服务。Flink 用来提供服务的端口是由用户和应用程序 ID 作为偏移配置的，这使得用户能够并行执行多个 YARN 会话。

c、之后，AM 开始为 Flink 的 TaskManager 分配容器（Container），从 HDFS 下载 JAR 文件和修改过的配置文件。一旦这些步骤完成了，Flink 就安装完成并准备接受任务了。

Flink on n Yarn 模式在使用的时候又可以分为两种：

第 1 种模式(Session-Cluster)：是在 YARN 中提前初始化一个 Flink 集群(称为 Flink yarn-session)，开辟指定的资源，以后的 Flink 任务都提交到这里。这个 Flink 集群会常驻在 YARN 集群中，除非手工停止。这种方式创建的 Flink 集群会独占资源，不管有没有 Flink 任务在执行，YARN 上面的其他任务都无法使用这些资源。

第 2 种模式(Per-Job-Cluster)：每次提交 Flink 任务都会创建一个新的 Flink 集群，每个 Flink 任务之间相互独立、互不影响，管理方便。任务执行完成之后创建的 Flink集群也会消失，不会额外占用资源，按需使用，这使资源利用率达到最大，在工作中推荐使用这种模式。

注意：Flink on Yarn 还需要两个先决条件：

a、配置 Hadoop 的环境变量

b、下载 Flink 提交到 Hadoop 的连接器（jar 包），并把 jar 拷贝到 Flink 的 lib 目录下

1) Session-Cluster 模式（ yarn-session ）

1 先启动 Hadoop 集群，然后通过命令启动一个 Flink 的 yarn-session 集群：

bin/yarn-session.sh -n 3 -s 3 -nm bjsxt -d

其中 yarn-session.sh 后面支持多个参数。下面针对一些常见的参数进行讲解：

a、 -n,--container <arg> 表示分配容器的数量（也就是 TaskManager 的数量）。

b、 -D <arg> 动态属性。

c、 -d,--detached 在后台独立运行。

d、 -jm,--jobManagerMemory <arg>：设置 JobManager 的内存，单位是 MB。

e、 -nm,--name：在 YARN 上为一个自定义的应用设置一个名字。

f、 -q,--query：显示 YARN 中可用的资源（内存、cpu 核数）。

g、 -qu,--queue <arg>：指定 YARN 队列。

h、 -s,--slots <arg>：每个 TaskManager 使用的 Slot 数量。

r、 -tm,--taskManagerMemory <arg>：每个 TaskManager 的内存，单位是 MB。

j、 -z,--zookeeperNamespace <arg>：针对 HA 模式在 ZooKeeper 上创建 NameSpace。

k、 -id,--applicationId <yarnAppId>：指定 YARN 集群上的任务 ID，附着到一个后台独立运行的 yarn session 中。

2 查看 WebUI: 由于还没有提交 Flink job，所以都是 0。

这个时候注意查看本地文件系统中有一个临时文件。有了这个文件可以提交 job 到 Yarn

3 提交 Job : 由于有了之前的配置，所以自动会提交到 Yarn 中。

bin/flink run -c com.bjsxt.flink.StreamWordCount /home/Flink-Demo-1.0-SNAPSHOT.jar

至此第一种模式全部完成。

2) Pre-Job-Cluster 模式（yarn-cluster）

这种模式下不需要先启动 yarn-session。所以我们可以把前面启动的 yarn-session 集群先停止，停止的命令是:

yarn application -kill application_1576832892572_0002

//其中 application_1576832892572_0002 是ID

确保 Hadoop 集群是健康的情况下直接提交 Job 命令：

bin/flink run -m yarn-cluster -yn 3 -ys 3 -ynm bjsxt02 -c

com.bjsxt.flink.StreamWordCount /home/Flink-Demo-1.0-SNAPSHOT.jar

可以看到一个全新的 yarn-session

任务提交参数讲解：相对于 Yarn-Session 参数而言，只是前面加了 y。

a、 -yn,--container <arg> 表示分配容器的数量，也就是 TaskManager 的数量。

b、 -d,--detached：设置在后台运行。

c、 -yjm,--jobManagerMemory<arg>:设置 JobManager 的内存，单位是 MB。

d、 -ytm，--taskManagerMemory<arg>:设置每个 TaskManager 的内存，单位是 MB。

e、 -ynm,--name:给当前 Flink application 在 Yarn 上指定名称。

f、 -yq,--query：显示 yarn 中可用的资源（内存、cpu 核数）

g、 -yqu,--queue<arg> :指定 yarn 资源队列

h、 -ys,--slots<arg> :每个 TaskManager 使用的 Slot 数量。

i、 -yz,--zookeeperNamespace<arg>:针对 HA 模式在 Zookeeper 上创建 NameSpace

j、 -yid,--applicationID<yarnAppId> : 指定 Yarn 集群上的任务 ID,附着到一个后台独立运行的 Yarn Session 中。

4. Flink 的的 HA

默认情况下，每个 Flink 集群只有一个 JobManager，这将导致单点故障（SPOF），如果这个 JobManager 挂了，则不能提交新的任务，并且运行中的程序也会失败。使用JobManager HA，集群可以从 JobManager 故障中恢复，从而避免单点故障。用户可以在Standalone 或 Flink on Yarn 集群模式下配置 Flink 集群 HA（高可用性）。

Standalone 模式下，JobManager 的高可用性的基本思想是，任何时候都有一个 Alive JobManager 和多个 Standby JobManager。Standby JobManager 可以在 Alive JobManager挂掉的情况下接管集群成为 Alive JobManager，这样避免了单点故障，一旦某一个 StandbyJobManager 接管集群，程序就可以继续运行。Standby JobManagers 和 Alive JobManager实例之间没有明确区别，每个 JobManager 都可以成为 Alive 或 Standby。

1) Flink Standalone 集群的 HA 安装和配置( 目前测试 1.9 版本有 bug)

实现 HA 还需要依赖 ZooKeeper 和 HDFS，因此要有一个 ZooKeeper 集群和 Hadoop 集群，

首先启动 Zookeeper 集群和 HDFS 集群。我们的课程中分配 3 台 JobManager，如下表：

hadoop101	hadoop102	hadoop103
JobManager	JobManager	JobManager
TaskManager	TaskManager	TaskManager

1 修改配置文件 conf/masters

2 修改配置文件 conf/flink-conf.yaml

#要启用高可用，设置修改为zookeeper

high-availability: zookeeper

#Zookeeper的主机名和端口信息，多个参数之间用逗号隔开

high-availability.zookeeper.quorum:

hadoop103:2181,hadoop101:2181,hadoop102:2181

# 建议指定HDFS的全路径。如果某个Flink节点没有配置HDFS的话，不指定HDFS的全路径则无法识到，storageDir存储了恢复一个JobManager所需的所有元数据。

high-availability.storageDir: hdfs://hadoop101:9000/flink/h

3 把修改的配置文件拷贝其他服务器中

[root@hadoop101 conf]# scp masters flink-conf.yaml root@hadoop102:`pwd`

[root@hadoop101 conf]# scp masters flink-conf.yaml root@hadoop103:`pwd`

4 启动集群

版本问题：目前使用 Flink1.7.1 版本测试没有问题，使用 Flink1.9 版本存在 HA 界面不能自动跳转到对应的 Alive JobManager 的现象。

2) Flink On Yarn HA 安装和配置

正常基于 Yarn 提交 Flink 程序，无论是使用 yarn-session 模式还是 yarn-cluster 模式，基于 yarn 运行后的 application 只要 kill 掉对应的 Flink 集群进程“YarnSessionClusterEntrypoint”后，基于 Yarn 的 Flink 任务就失败了，不会自动进行重试，所以基于 Yarn 运行 Flink 任务，也有必要搭建 HA，这里同样还是需要借助 zookeeper来完成，步骤如下：

1 修改所有 Hadoop 节点的 yarn-site.xml

将所有 Hadoop 节点的 yarn-site.xml 中的提交应用程序最大尝试次数调大

#在每台hadoop节点yarn-site.xml中设置提交应用程序的最大尝试次数，建议不低于4，这里重试指的是ApplicationMaster
<property>
      <name>yarn.resourcemanager.am.max-attempts</name>
      <value>4</value>
</property>

2 启动 Hadoop 集群

启动 zookeeper，启动 Hadoop 集群。

3 修改 Flink 对应 flink-conf.yaml 配置

配置对应的 conf 下的 flink-conf.yaml，配置内容如下：

#配置依赖zookeeper模式进行HA搭建
high-availability: zookeeper
#配置JobManager原数据存储路径
high-availability.storageDir: hdfs://hadoop101:9000/flink/yarnha/
#配置zookeeper集群节点
high-availability.zookeeper.quorum:
hadoop101:2181,hadoop102:2181,hadoop103:2181
#yarn停止一个application重试的次数
yarn.application-attempts: 10

4 启动 yarn-session.sh 测试 HA： yarn-session.sh -n 2 ，也可以直接提交 Job启动之后，可以登录 yarn 中对应的 flink webui，如下图示：

点击对应的 Tracking UI，进入 Flink 集群 UI:

查看对应的 JobManager 在哪台节点上启动：

进入对应的节点，kill 掉对应的“YarnSessionClusterEntrypoint”进程。然后进入到 Yarn中观察“applicationxxxx_0001”job 信息：

点击 job ID,发现会有对应的重试信息：

点击对应的“Tracking UI”进入到 Flink 集群 UI，查看新的 JobManager 节点由原来的hadoop103 变成了 hadoop101，说明 HA 起作用。

5. Flink 并行度和 Slot

Flink中每一个worker(TaskManager)都是一个JVM进程，它可能会在独立的线程（Solt）上执行一个或多个 subtask。Flink 的每个 TaskManager 为集群提供 Solt。Solt 的数量通常与每个 TaskManager 节点的可用 CPU 内核数成比例，一般情况下 Slot 的数量就是每个节点的 CPU 的核数。

Slot 的数量由集群中 flink-conf.yaml 配置文件中设置taskmanager.numberOfTaskSlots 的值为 3，这个值的大小建议和节点 CPU 的数量保持一致。