Flink on yarn集群HA配置

11 篇文章 0 订阅
4 篇文章 0 订阅

1.集群规划

Flink on yarn 的HA其实是利用yarn自己的恢复机制。
在这里需要用到ZK,主要是因为虽然flink-on-yarn cluster HA 依赖于Yarn自己的集群机制,但是在Flink job在恢复时,需要依赖检查点产生的快照,而这些快照虽然配置在hdfs,但是其元数据信息保存在zookeeper中,所以我们还要配置zookeeper的信息
hadoop集群:master、slave1、slave2
zookeeper服务:master、slave1、slave2
在这里插入图片描述

2.配置

主要在master上配置
1.首先需要修改hadoop集群中所有节点中yarn-site.xml中的配置,设置提交应用程序的最大尝试次数

<property> 
<name>yarn.resourcemanager.am.max-attempts</name> 
<value>4</value> 
<description> Themaximumnumberofapplicationmasterexecutionattempts. </description>
 </property>

在这里插入图片描述
2.解压一份Flink安装包

tar -zxvf flink-1.6.1-bin-hadoop27-scala_2.11.tgz

在这里插入图片描述

3.配置flink-conf.yaml

vi conf/flink-conf.yaml
high-availability:zookeeper
high-availability.zookeeper.quorum:master:2181,slave1:2181,slave2:2181
high-availability.storageDir:hdfs://hadoop100:9000/flink/ha-yarn
high-availability.zookeeper.path.root:/flink-yarn
yarn.application-attempts:10

在这里插入图片描述
4.启动集群
先启动master、slave1、slave2上的hadoop和zookeeper

bin/zkServer.sh start
 sbin/start-all.sh

zookeeper
在这里插入图片描述

在master上启动Flink集群

bin/yarn-session.sh-n2

在这里插入图片描述
web查看http://slave2:44400
在这里插入图片描述
到 resoucemanager 的 web 界面上查看对应的 flink 集群在哪个节点上,web查看http://master:8088
在这里插入图片描述
jobmanager 进程就在对应的节点(YarnSessionClusterEntrypoint)进程里
在这里插入图片描述

5.测试
所以想要测试 jobmanager 的 HA 情况,只需要拿YarnSessionClusterEntrypoint 这个进程进行 测试即可。
执行下面命令手工模拟 kill 掉jobmanager(YarnSessionClusterEntrypoint

在这里插入图片描述
然后去 yarn 的 web 界面进行查看:
在这里插入图片描述
再在slave1下查看进程:jps
在这里插入图片描述
发现YarnSessionClusterEntrypoint跑在了slave1上。
集群HA完成!

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值