Flink中task的failover机制

最新推荐文章于 2024-06-23 10:34:13 发布

Wu_San

最新推荐文章于 2024-06-23 10:34:13 发布

阅读量2.6k

点赞数

文章标签： flink 大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Wu_San/article/details/105669186

版权

Flink中的failover分为task的failover和Master的failover。
我们先来看task的failover，它有多种策略：
1.Restart-all
重启所有的task，从上次的Checkpoint开始重新执行。
在这里插入图片描述
2.Restart-individual
只重启出错的task，只适用于task间无连接的情况，应用场景有限。

3.Restart-region
重启pipeline region。因为block边数据落盘，可以直接读取，逻辑上仅需重启通过pipeline边关联的task。
(block边:数据有落盘。pipeline边：数据不落盘)

如果是作业自身执行失败，则只需重启和该task相关的位于block后面的task。
如果是作业读取上游数据失败，则需要将产出上游数据的所有task以及下游和该失败task相连接的所有task重启。

再看Master的failover的恢复策略：

多个Master通过ZK进行选举。
目前要求所有task重启。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Flink中task的failover机制

sadga
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。