Checkpoints

朕去幼儿园深造

已于 2022-02-08 21:52:03 修改

阅读量1.1k

点赞数

文章标签： flink

于 2022-02-08 21:51:33 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45126258/article/details/122831774

版权

Checkpoints

检查点机制

检查点机制

Fink中基于异步轻量级的分布式快照技术提供了Checkpoints容错机制，分布式快照可以将同一时间点Task/Operator的状态数据全局统一快照处理。
Flink会在输入的数据集上间歇性地生成checkpoint barrier，通过barrier将间隔时间段内的数据划分到相应的checkpoint中，当应用出现异常时，Operator就能够从上一次快照中恢复所有算子之前的状态，从而保证一致性。
对于状态占用空间较小的应用，快照产生过程非常轻量，高频率创建且对flink任务性能影响相对较小。checkpoint过程中状态数据一般被保存在一个可配置的环境中，通常在JobManager节点或者hdfs上
检查点默认是不开启的

checkpoint开启和时间间隔指定

checkpoint开启和时间间隔指定（根据实际情况选择，状态较大，建议适当增加n的值）

env.enableCheckpointing(1000);

exactly-once和at-least-once语义的选择

默认是使用exactly-ance
exactly-ance：保证整个应用内端到端的数据一致性，这种适合数据要求较高，不允许出现丢数据或者数据重复，同时这种情况flink的性能也相对较弱
at-least-once：适合于延时和吞吐量非常高但对数据的一致性要求不高的场景。

env.getCheckpointConfig().setCheckpointingMode(CheckpointingMode.EXACTLY

最低0.47元/天解锁文章

朕去幼儿园深造

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Checkpoints

Checkpoints检查点机制checkpoint开启和时间间隔指定exactly-once和at-least-once语义的选择Checkpoint超时时间检查点之间的最小时间间隔最大并行执行的检查点数量外部检查点failOnCheckpointingErrors检查点机制Fink中基于异步轻量级的分布式快照技术提供了Checkpoints容错机制，分布式快照可以将同一时间点Task/Operator的状态数据全局统一快照处理。Flink会在输入的数据集上间歇性地生成checkpoint barr
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。