Flink的Checkpoints机制详解

最新推荐文章于 2024-04-17 00:15:14 发布

大数据架构师Evan

最新推荐文章于 2024-04-17 00:15:14 发布

阅读量310

点赞数 1

文章标签：数据库 flink 数据可视化 storm hdfs

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_52346300/article/details/116022062

版权

这是我的第83篇原创所有的数据处理工具都面临数据高可靠、高可用的问题，一旦服务发生问题，如何保证数据不会丢失？高可靠解决方案MySQL用BinLog来解决这个问题，它把每一步事务操作都记录...

摘要由CSDN通过智能技术生成

这是我的第83篇原创

所有的数据处理工具都面临数据高可靠、高可用的问题，一旦服务发生问题，如何保证数据不会丢失？

高可靠解决方案

MySQL用BinLog来解决这个问题，它把每一步事务操作都记录下来，一旦发生问题，可以追踪binlog找到每一步的操作记录。MySQL还会提供快照、备份的功能。

HDFS通过多副本和ZooKeeper的选举机制来解决这个问题，它会把收到的每一份数据存成N个副本，当发生故障的时候，通过ZooKeeper来确定最新的副本数据。另外，HDFS也提供快照SnapShot的功能。

storm里面是通过ack和Trident搞定。

Spark比较复杂，不同版本不一样，1.3之前是用Receiver保存offset，重启后先获取上一次的offset，然后到kafka重新读取数据。1.3之后，跟Flink一样用checkpoint机制存储任务所有元数据，包括offset。具体可以看我之前分析的这篇文章，点击查看：SparkStreaming实时任务处理的三种语义。

Flink的Checkpoint机制

MySQL的思想很容易理解，就像棋谱一样，把每一步都记录下来。后人读棋谱，

最低0.47元/天解锁文章

大数据架构师Evan

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
Flink的Checkpoints机制详解

这是我的第83篇原创所有的数据处理工具都面临数据高可靠、高可用的问题，一旦服务发生问题，如何保证数据不会丢失？高可靠解决方案MySQL用BinLog来解决这个问题，它把每一步事务操作都记录...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。