flink standalone 部署模式且不能使用 hdfs 场景下的各种问题及其应对方案

最新推荐文章于 2022-10-16 11:29:32 发布

明哥的IT随笔

最新推荐文章于 2022-10-16 11:29:32 发布

阅读量1.6k

点赞数

文章标签：大数据 hadoop spark java hive

本文链接：https://blog.csdn.net/MichaelLi916/article/details/119458879

版权

本文分析了Flink在standalone模式下不能使用HDFS的场景，面临的Job Manager高可用、Catalog管理和State Backend问题。解决方案包括使用Zookeeper替代HDFS进行HA存储，对于Catalog，可以选择内存Catalog并重新执行DDL，或在独立环境安装Hive。State Backend推荐使用FsStateBackend或RocksDBStateBackend，存储在本地文件系统。

摘要由CSDN通过智能技术生成

一。背景

笔者所在公司某系统在某证券公司现场部署时，客户出于自己集群使用规划的考量，不允许 flink 访问大数据集群，既不能使用yarn资源管理器，也不能访问hdfs文件系统，而该系统中中 flink 应用程序的数据链路是 flink sql 读取 kafka topic中的数据，进行计算分析后写到es中供下游业务系统使用，计算过程中使用到了 flink 的 table api和sql。

该场景其实是flinkstandalone 部署模式且不能使用 hdfs 的典型场景，我在这里汇总分析了下该场景下相关的技术问题，并结合flink相关技术点的细节和原理，给出了各个问题可能的解决方案，供大家参考。

问题主要分为三大类：jobmanager 高可用部署，catalog配置和使用，以及state backend 配置和使用。

以下是正文。

二。什么是 standalone 部署模式

首先明确下什么是 flink 的standalone 部署模式。

flink的 standalone 部署模式，即standalone deploy mode，是从 flink 集群的resource provider的角度说的，指的是flink直接在操作系统上启动flink 相关服务如client, jobmanager, taskmanager，而不依赖其它资源管理框架如yarn, mesos, k8s进行资源管理。

此时是由 flink直接来进行集群资源管理的，比如监控和重启失败的服务进程，分配和释放资源等等。

需要说明的是，standalone模式下，也可以结合使用docker和k8s （flink将使用k8s作为资源管理框架的模式称为native k8s mode，以跟standalone模式下的k8s进行区分）。

三。standalone 部署模式跟 hdfs 的关系

接着看下 standalone 部署模式跟 hdfs 的关系。

通过以上概念可以看出，flink的standalone模式，跟flink是否能访问大数据集群中的hdfs没有任何关系。

很多standalone模式的flink，仍然使用的是大数据集群中的hdfs，作为job manager 高可用部署的后端存储（high-availability.storageDir），作为 checkpoint 时状态快照的后端存储（state.checkpoints.dir/state.savepoints.dir）。

四。standalone 部署模式且不能使用hdfs场景下各种问题及其应对方案

最低0.47元/天解锁文章

明哥的IT随笔

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
flink standalone 部署模式且不能使用 hdfs 场景下的各种问题及其应对方案

点击上方蓝色“明哥的IT随笔”，关注并选择“设为星标”，keep striving! 欢迎关注知乎同名专栏！一。背景笔者所在公司某系统在某证券公司现场部署时，客户出于自己集群使用规划的考量...
复制链接

扫一扫