Flink实战二 Flink的基本架构和原理

最新推荐文章于 2024-08-06 09:24:28 发布

置顶 cenjianteng

最新推荐文章于 2024-08-06 09:24:28 发布

阅读量3.6k

点赞数

分类专栏：大数据 Flink 文章标签： Flink架构和原理 Flink的组件栈 Flink的基本架构 Flink的基本概念

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/cenjianteng/article/details/99096431

版权

大数据同时被 2 个专栏收录

8 篇文章 0 订阅

订阅专栏

4 篇文章 1 订阅

订阅专栏

组件栈

API & Libraries层

基于流处理的：CEP（复杂事件处理库）、SQL&Table库

基于批处理的：FlinkML（机器学习库）、GElly（图处理库）等

API层： DataStream API（流计算）、DataSet API（批计算）

Core层

支持分布式Stream作业的执行、JobGraph到ExecutionGraph的映射转换、任务调度等。将DataStream 和 DataSet 转换成统一的可执行的Task Operator，达到在流引擎下同时处理批量计算和流计算。

Deploy层

支持本地、集群（Standalone/yarn）、云（GCE/EC2）、Kubernetes、Mesos 不同平台部署。

基本架构

Flink主要由两个组件组成Jobmanager和TaskManager，Jobmanager为master节点，TaskManager为worker（slave）节点。所有组件之间用Akka进行通信，包括任务的状态和Checkpoint触发等。

Client 客户端

通过Actor System（Akka）连接JobManager，然后将任务提交到JobManager，获取任务执行状态。

JobManager(Master)

负责整个集群的任务调度以及资源管理。获取客户端提交的任务，根据TaskManager上的TaskSlot使用情况，为提交的任务分配相应的TaskSlots资源并命令TaskManager启动从客户端中提交的任务。JobManager会触发Checkpoints，由TaskManager完成Checkpoint操作。JobManager将任务执行的信息反馈给客户端，并释放资源。

TaskManager(Worker)

负责具体的任务执行和对应任务在每个节点上资源申请与管理。TaskManager接受JobManager提交的任务，然后使用Task Slot启动task，开始执行数据处理。

参考以下资料：

https://flink.apache.org/

https://github.com/apache/flink

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。