Checkpointing

最新推荐文章于 2024-03-25 08:55:59 发布

universe_ant

最新推荐文章于 2024-03-25 08:55:59 发布

阅读量394

点赞数

分类专栏： 00-Flink 文章标签： Flink

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/universe_ant/article/details/90799349

版权

00-Flink 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

一、Checkpointing

下图主要是描述word count的Job逻辑：

barrier由source节点发出；
barrier会将流上event切分到不同的checkpoint中；
汇聚到当前节点的多流的barrier要对齐；
barrier对齐之后会进行checkpointing，生成snapshot；
完成snapshot之后向下游发出barrier，继续直到sink节点。

二、Exactly-Once vs. At-Least-Once

Flink中通过barrier对齐保证内部的Exactly-Once处理，那么是怎么做到的呢？下面来分析一下：

当在Exactly-Once语义下，多流输入到某一个节点时，当其中一部分barrier到达该节点时，会对这部分barrier后面到达的数据进行阻塞并缓存下来，直到其余部分输入的barrier也到达该节点，这时多流的barrier对齐了，然后会进行checkpointing，接着把barrier发送到下游。

当在At-Least-Once语义下，多流输入到某一个节点时，当其中一部分barrier到达该节点时，不会对这部分barrier后面到达的数据进行阻塞，仍然会发送给下游，这样的话，checkpoint n-1中可能会处理barrier n-1之后的数据，那么这种情况下，在故障恢复时数据可能会被多次处理。

参考自：Fault Tolerance

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。