大数据最新大数据-玩转数据-FLINK(Yarn模式)的安装与部署_flink安装(2)

最新推荐文章于 2024-05-31 08:30:00 发布

2401_84182146

最新推荐文章于 2024-05-31 08:30:00 发布

阅读量649

点赞数 5

分类专栏：程序员文章标签：大数据 flink java

本文链接：https://blog.csdn.net/2401_84182146/article/details/138436173

版权

本文介绍了Flink在YARN高可用（HA）模式下的部署，详细阐述了从基本环境搭建到内存管理模式的要点。包括克隆虚拟机、创建hadoop用户、修改hostname、配置免密登录、关闭防火墙、目录规划和JDK 1.8的安装。重点讲解了Flink如何在YARN上动态分配TaskManager资源，以及两种内存管理模式的差异，推荐使用Job管理模式。

摘要由CSDN通过智能技术生成

其次，Flink 是大数据计算框架，不是资源调度框架，这并不是它的强项；所以还是应该让专业的框架做专业的事，和其他资源调度框架集成更靠谱。而在目前大数据生态中，国内应用最为广泛的资源管理平台就是 YARN 了。在强大的 YARN 平台上 Flink 是如何集成部署的。整体来说，YARN 上部署的过程是：客户端把 Flink 应用提交给 Yarn 的 ResourceManager,Yarn 的 ResourceManager 会向 Yarn 的 NodeManager 申请容器。在这些容器上，Flink 会部署JobManager 和 TaskManager 的实例，从而启动集群。Flink 会根据运行在 JobManger 上的作业所需要的 Slot 数量动态分配 TaskManager 资源。

而且，Flink on Yarn模式安装部署要做的其实不多，正常的步骤：上传二进制包，解压，更改文件名称，配置环境变量。

再有，Fink on Yarn 有两种内存管理模式。

内存集中管理模式：在Yarn中初始化一个Flink集群，开辟指定的资源，之后我们提交的Flink Jon都在这个Flink yarn-session中，也就是说不管提交多少个job，这些job都会共用开始时在yarn中申请的资源。这个Flink集群会常驻在Yarn集群中，除非手动停止。

内存Job管理模式【推荐使用】：在Yarn中，每次提交job都会创建一个新的Flink集群，任务之间相互独立，互不影响并且方便管理。任务执行完成之后创建的集群也会消失。

二、Flink on Yarn HA 模式部署

2.1、基本环境搭建

最低0.47元/天解锁文章

2401_84182146

关注

5
点赞
踩
7

收藏

觉得还不错? 一键收藏
2
评论
大数据最新大数据-玩转数据-FLINK(Yarn模式)的安装与部署_flink安装(2)

其次，Flink 是大数据计算框架，不是资源调度框架，这并不是它的强项；所以还是应该让专业的框架做专业的事，和其他资源调度框架集成更靠谱。而在目前大数据生态中，国内应用最为广泛的资源管理平台就是 YARN 了。在强大的 YARN 平台上 Flink 是如何集成部署的。整体来说，YARN 上部署的过程是：客户端把 Flink 应用提交给 Yarn 的 ResourceManager,Yarn 的 ResourceManager 会向 Yarn 的 NodeManager 申请容器。
复制链接

扫一扫