Flink Standalone HA集群的安装配置

最新推荐文章于 2025-09-16 17:05:44 发布

原创

最新推荐文章于 2025-09-16 17:05:44 发布 · 1.3k 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#flink

Flink集群有两种部署的模式，分别是Standalone以及YARNCluster模式。

Standalone模式：Flink必须依赖于ZooKeeper来实现JobManager的HA（Zookeeper 已经成为了大部分开源框架HA必不可少的模块）。在Zookeeper的帮助下，一个Standalone的Flink集群会同时有多个活着的 JobManager，其中只有一个处于工作状态，其他处于Standby状态。当工作中的JobManager失去连接（如宕机或Crash），ZooKeeper会从Standby中选举新的JobManager来接管Flink集群。

YARN Cluaster模式：Flink就要依靠YARN本身来对JobManager做HA了。其实这里完全是YARN的机制。对于YARNCluster模式来说，JobManager和TaskManager都是启动在YARN的Container中。此时的 JobManager，其实应该称之为Flink Application Master。也就说它的故障恢复，就完全依靠着YARN中的ResourceManager（和 MapReduce的AppMaster一样）。由于完全依赖了YARN，因此不同版本的YARN可能会有细微的差异。

Local模式

1、解压flink安装包并重命名

tar -zxf flink-1.9.3-bin-scala_2.11.tgz

mv flink-1.9.3 flink

2、配置flink环境变量

#需要配置 HADOOP_CONF_DIR 环境变量，否则会有提示

export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop

3、配置文件flink/conf说明

需要配置的文件有：masters、slaves、flink-conf.yaml文件，其中masters文件是用来配置HA的，只要我们不配置HA（高可用性）的话，就不需要配置masters文件；slaves是用来配置从节点个数（flink也是master/slave结构）；flink-conf.yaml文件用来配置集群其他相关信息

4、Local模式中JobManager和TaskManager共用一个JVM来完成WorkLoad。如果验证一个简单的应用，Local 模式是最方便的，实际应用中大多使用Standalone或者Yarn Cluster。Local模式只需要将安装包解压，使用./bin/start-cluster.sh启动即可，看到有如下两个进程即启动成功，使用stop-cluster.sh即可关闭集群