面试题百日百刷-flink篇(八)

最新推荐文章于 2024-06-19 00:03:39 发布

zjlala96

最新推荐文章于 2024-06-19 00:03:39 发布

阅读量40

点赞数

分类专栏： Flink 面试题百日百刷每日一题文章标签： flink kafka java

原文链接：https://www.demosoftware.cn

版权

面试题百日百刷同时被 3 个专栏收录

84 篇文章 2 订阅

订阅专栏

12 篇文章 0 订阅

订阅专栏

11 篇文章 0 订阅

订阅专栏

锁屏面试题百日百刷，每个工作日坚持更新面试题。请看到最后就能获取你想要的,接下来的是今日的面试题：

1.Operator Chains（算子链）这个概念你了解吗？

为了更高效地分布式执行，Flink会尽可能地将operator的subtask链接（chain）在一起形成task。每个task在一个线程中执行。将operators链接成task是非常有效的优化：它能减少线程之间的切换，减少消息的序列化/反序列化，减少数据在缓冲区的交换，减少了延迟的同时提高整体的吞吐量。这就是我们所说的算子链。

2.Flink什么情况下才会把Operator chain在一起形成算子链？

两个operator chain在一起的的条件：

上下游的并行度一致

下游节点的入度为1 （也就是说下游节点没有来自其他节点的输入）

上下游节点都在同一个 slot group 中（下面会解释 slot group）

下游节点的 chain 策略为 ALWAYS（可以与上下游链接，map、flatmap、filter等默认是ALWAYS）

上游节点的 chain 策略为 ALWAYS 或 HEAD（只能与下游链接，不能与上游链接，Source默认是HEAD）

两个节点间数据分区方式是 forward（参考理解数据流的分区）

用户没有禁用 chain

3.flink中消费kafka数据的时候，如何处理脏数据？

可以在处理前加一个fliter算子，将不符合规则的数据过滤出去。

4.Flink Job的提交流程

用户提交的Flink Job会被转化成一个DAG任务运行，分别是：StreamGraph、JobGraph、ExecutionGraph，Flink中JobManager与TaskManager，JobManager与Client的交互是基于Akka工具包的，是通过消息驱动。整个Flink Job的提交还包含着ActorSystem的创建，JobManager的启动，TaskManager的启动和注册。

5.Flink所谓"三层图"结构是哪几个"图"？

一个Flink任务的DAG生成计算图大致经历以下三个过程：

1)StreamGraph 最接近代码所表达的逻辑层面的计算拓扑结构，按照用户代码的执行顺序向

StreamExecutionEnvironment添加StreamTransformation构成流式图。

2)JobGraph 从StreamGraph生成，将可以串联合并的节点进行合并，设置节点之间的边，安排资源共享slot槽位和放置相关联的节点，上传任务所需的文件，设置检查点配置等。相当于经过部分初始化和优化处理的任务图。

3)ExecutionGraph 由JobGraph转换而来，包含了任务具体执行所需的内容，是最贴近底层实现的执行图。

全部内容在[git](https://gitee.com/zjlalaforgit/interview)上,了解更多请点我头像或到我的主页去获得，谢谢

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
面试题百日百刷-flink篇(八)

整个Flink Job的提交还包含着ActorSystem的创建，JobManager的启动，TaskManager的启动和注册。将operators链接成task是非常有效的优化：它能减少线程之间的切换，减少消息的序列化/反序列化，减少数据在缓冲区的交换，减少了延迟的同时提高整体的吞吐量。这就是我们所说的算子链。2)JobGraph 从StreamGraph生成，将可以串联合并的节点进行合并，设置节点之间的边，安排资源共享slot槽位和放置相关联的节点，上传任务所需的文件，设置检查点配置等。
复制链接

扫一扫

专栏目录

zjlala96 CSDN认证博客专家 CSDN认证企业博客

码龄11年

92: 原创

10万+: 周排名

45万+: 总排名

4万+: 访问

: 等级

1283: 积分

41: 粉丝

6: 获赞

3: 评论

54: 收藏

私信

关注

热门文章

分类专栏

demo软件园 71篇
工具推荐使用 41篇
资源分享 55篇
电子书 36篇
大厂面试题 58篇
面试题百日百刷 84篇
java基础 8篇
spark 18篇
每日一题 12篇
Flink 11篇
kafka 2篇
HBase 8篇
学习路径 1篇
360度无死角学习路线 2篇
Flume 2篇
Hive 11篇
中间件 4篇
javaEE 7篇
网络编程 4篇
数据库 3篇
安卓开发 2篇

最新评论

面试题百日百刷-java基础篇(十一)
CSDN-Ada助手: 恭喜您入围持续学习7天榜单「2023-05-30」榜单, 连续学习: 7 天, 排名: 「4」, 一定要再接再厉哦, 争取拿到更好成绩, 榜单详情请看: https://bbs.csdn.net/topics/615602993 更多创作活动请看: 物联网技术正在如何影响我们的生活: https://activity.csdn.net/creatActivity?id=10421?utm_source=csdn_ai_ada_redpacket 新星计划2023: https://marketing.csdn.net/p/1738cda78d47b2ebb920916aab7c3584?utm_source=csdn_ai_ada_redpacket AI写作助手创作测评: https://activity.csdn.net/creatActivity?id=10450?utm_source=csdn_ai_ada_redpacket 全部创作活动: https://mp.csdn.net/mp_blog/manage/creative?utm_source=csdn_ai_ada_redpacket
每日分享(Thinphp开发的证书查询系统源码支持自适应多端PC+WAP含安装教程)
（）197: 安装教程在哪
Android核心技术之入门Hello world
我爱人工智能: 写的很详细

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。