Flink容错机制

最新推荐文章于 2022-03-28 23:19:35 发布

bigdata_wangzhe

最新推荐文章于 2022-03-28 23:19:35 发布

阅读量98

点赞数

分类专栏： flink 文章标签： flink

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/bigdata_wangzhe/article/details/114710386

版权

flink 专栏收录该内容

9 篇文章 0 订阅

订阅专栏

一致性检查点（Checkpoints）

在这里插入图片描述

Flink 故障恢复机制的核心，就是应用状态的一致性检查点
有状态流应用的一致检查点，其实就是所有任务的状态，在某个时间点的一份拷贝（一份快照）；这个时间点，应该是所有任务都恰好处理完一个相同的输入数据的时候

从检查点恢复状态

在这里插入图片描述

在执行流应用程序期间，Flink 会定期保存状态的一致检查点
如果发生故障， Flink 将会使用最近的检查点来一致恢复应用程序的状态，并重新启动处理流程

从检查点恢复状态

遇到故障之后，第一步就是重启应用
第二步是从 checkpoint 中读取状态，将状态重置
从检查点重新启动应用程序后，其内部状态与检查点完成时的状态完全相同

第三步：开始消费并处理检查点到发生故障之间的所有数据
这种检查点的保存和恢复机制可以为应用程序状态提供“精确一次”（exactly-once）的一致性，因为所有算子都会保存检查点并恢复其所有状态，这样一来所有的输入流就都会被重置到检查点完成时的位置

检查点的实现算法

种简单的想法
—— 暂停应用，保存状态到检查点，再重新恢复应用
Flink 的改进实现
1. 基于 Chandy-Lamport 算法的分布式快照
2. 将检查点的保存和数据处理分离开，不暂停整个应用
Flink 检查点算法

检查点分界线（Checkpoint Barrier）

Flink 的检查点算法用到了一种称为分界线（barrier）的特殊数据形式，用来把一条流上数据按照不同的检查点分开
分界线之前到来的数据导致的状态更改，都会被包含在当前分界线所属的检查点中；而基于分界线之后的数据导致的所有更改，就会被包含在之后的检查点中

Flink 检查点算法

现在是一个有两个输入流的应用程序，用并行的两个 Source 任务来读取
JobManager 会向每个 source 任务发送一条带有新检查点 ID 的消息，通过这种方式来启动检查点
数据源将它们的状态写入检查点，并发出一个检查点 barrier
状态后端在状态存入检查点之后，会返回通知给 source 任务，source 任务就会向 JobManager 确认检查点完成
分界线对齐：barrier 向下游传递，sum 任务会等待所有输入分区的 barrier 到达

对于barrier已经到达的分区，继续到达的数据会被缓存
而barrier尚未到达的分区，数据会被正常处理

当收到所有输入分区的 barrier 时，任务就将其状态保存到状态后端的检查点中，然后将 barrier 继续向下游转发
向下游转发检查点 barrier 后，任务继续正常的数据处理
Sink 任务向 JobManager 确认状态保存到 checkpoint 完毕

当所有任务都确认已成功将状态保存到检查点时，检查点就真正完成了

保存点（Savepoints）

Flink 还提供了可以自定义的镜像保存功能，就是保存点（savepoints）
原则上，创建保存点使用的算法与检查点完全相同，因此保存点可以认为就是具有一些额外元数据的检查点
Flink不会自动创建保存点，因此用户（或者外部调度程序）必须明确地触发创建操作
保存点是一个强大的功能。除了故障恢复外，保存点可以用于：有计划的手动备份，更新应用程序，版本迁移，暂停和重启应用，等等

bigdata_wangzhe

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Flink容错机制

一致性检查点（Checkpoints）Flink 故障恢复机制的核心，就是应用状态的一致性检查点有状态流应用的一致检查点，其实就是所有任务的状态，在某个时间点的一份拷贝（一份快照）；这个时间点，应该是所有任务都恰好处理完一个相同的输入数据的时候从检查点恢复状态在执行流应用程序期间，Flink 会定期保存状态的一致检查点如果发生故障， Flink 将会使用最近的检查点来一致恢复应用程序的状态，并重新启动处理流程从检查点恢复状态遇到故障之后，第一步就是重启应用第二步是从 chec
复制链接

扫一扫

专栏目录

bigdata_wangzhe CSDN认证博客专家 CSDN认证企业博客

码龄3年

66: 原创

32万+: 周排名

46万+: 总排名

3万+: 访问

: 等级

915: 积分

13: 粉丝

14: 获赞

12: 评论

80: 收藏

私信

关注

热门文章

分类专栏

大数据 31篇
实时数仓 4篇
flink 9篇
数据分析 3篇
java 12篇
机器学习 3篇
用户画像 1篇

最新评论

flink实时数仓(二)之dwd层
chenzuoli: 问下楼主，你的卡夫卡数据的生命周期是多长?kafka数据会定期删除，这样ods就会数据缺失，计算的结果是不是有问题呀?
实时计算之Flink CDC
珊丹丹花开红艳艳的学习笔记: 你好，请问有没有完整的源码
flink实时数仓(二)之dwd层
kele8boy: @Kliners 这个问题也正是我想问的。当业务数据库经常存在数据更新时，并且这条更新的数据，需要发送到kafka，进而更新后续dwd,dws层的数据时，用flink要怎么处理？
flink实时数仓(二)之dwd层
Kliners: 请问，如果一条更新数据到了kafka后，原先是有一条insert类型的数据，然后关联其他流的时候请问楼主是怎么处理的？比如订单有多个状态多次更新产生多条记录，关联item表就变多了；

大家在看

乌班图vscode编写点亮led烧写程序到正点原子I.MX6ULL开发板

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。