Flink Checkpoint 和 Savepoint 区别及其如何配置使用？

最新推荐文章于 2023-04-13 11:32:11 发布

zhisheng_blog

最新推荐文章于 2023-04-13 11:32:11 发布

阅读量558

点赞数

分类专栏：大数据实时计算引擎 Flink 实战与性能优化

本文链接：https://blog.csdn.net/tzs_1041218129/article/details/108728685

版权

大数据实时计算引擎 Flink 实战与性能优化专栏收录该内容

73 篇文章 29 订阅 ¥99.00 ¥99.00

订阅专栏

Checkpoint 在 Flink 中是一个非常重要的 Feature，Checkpoint 使 Flink 的状态具有良好的容错性，通过 Checkpoint 机制，Flink 可以对作业的状态和计算位置进行恢复。本节主要讲述在 Flink 中 Checkpoint 和 Savepoint 的使用方式及它们之间的区别。

Checkpoint 介绍及使用

为了保障的容错，Flink 需要对状态进行快照。Flink 可以从 Checkpoint 中恢复流的状态和位置，从而使得应用程序发生故障后能够得到与无故障执行相同的语义。

Flink 的 Checkpoint 有以下先决条件：

需要具有持久性且支持重放一定时间范围内数据的数据源。例如：Kafka、RabbitMQ 等。这里为什么要求支持重放一定时间范围内的数据呢？因为 Flink 的容错机制决定了，当 Flink 任务失败后会自动从最近一次成功的 Checkpoint 处恢复任务，此时可能需要把任务失败前消费的部分数据再消费一遍，所以必须要求数据源支持重放。假如一个消费 Kafka 写入数据到 MySQL 的 Flink 任务从 Kafka 读取到数据后，还未将输出到 MySQL 端任务突然失败了，如果不支持重放，就会造成这部分数据丢失。支持重放数据的数据源可以保障消费失败后能够重新消费来保障不丢数据。
需要保障状态的持久化存储。例如：HDFS、S3 等。当 Flink 任务失败后，自动从 Checkpoint 处恢复，但是如果 Checkpoint 时保存的状态信息快照全丢了，那就会影响 Flink 任务的正常恢复。就好比我们看书时经常使用书签来记录当前看到的页码，当下次看书时找到书签的位置继续阅读即可，但是如果书签三天两头经常丢，那我们就无法通过书签来恢复阅读。

Flink 中 Checkpoi

了解本专栏

zhisheng_blog

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
Flink Checkpoint 和 Savepoint 区别及其如何配置使用？

Checkpoint 在 Flink 中是一个非常重要的 Feature，Checkpoint 使 Flink 的状态具有良好的容错性，通过 Checkpoint 机制，Flink 可以对作业的状态和计算位置进行恢复。本节主要讲述在 Flink 中 Checkpoint 和 Savepoint 的使用方式及它们之间的区别。Checkpoint 介绍及使用为了保障的容错，Flink 需要对状态进...
复制链接

扫一扫