rocksdb原理_Flink原理—神秘的状态

最新推荐文章于 2024-04-24 00:37:10 发布

weixin_39862716

最新推荐文章于 2024-04-24 00:37:10 发布

阅读量639

点赞数

文章标签： rocksdb原理

本文链接：https://blog.csdn.net/weixin_39862716/article/details/112310225

版权

本文详细介绍了Flink中的状态管理，包括State的定义、作用和State Backend的选择，如MemoryStateBackend、FsStateBackend和RocksDBStateBackend。接着讨论了Checkpoint的原理、配置和优化，特别是非对齐Checkpoint的利弊。同时，解释了Savepoint的意义和触发方式，以及为何在程序逻辑修改后可能导致Savepoint不可用。最后，阐述了Flink的容错机制，如何结合流重播和Checkpoint实现故障恢复。

摘要由CSDN通过智能技术生成

十万个为什么

state、checkpoint、savepoint 之间有什么关系
在Flink1.11 中对状态相关的优化有哪些
state、checkpoint 、savepoint 存在的意义是什么
checkpoint 如何触发、如何设置
savepoint和checkpoint的关系

State

1、定义：

与时间相关的任务内部数据的快照

2、作用：

每次计算需要基于上一次计算的结果，故通过state将每次计算的中间结果进行持久化
出现错误需要从成功的检查点进行State的恢复
增量计算，Failover这些机制都需要state的支撑。

State Backends

1、作用：

决定状态的存储格式以及状态在CheckPoint时持久化格式和方式

2、分类：

(1)MemoryStateBackend【全量快照】：

以Java对象的形式存储在堆上
适用于开发调试

(2)FsStateBackend【全量快照】：

需配置 URL("hdfs://md:4010/checkpoints" 或 "file:///checkpoints")
正在运行中的状态数据保存在 TaskManager 的内存中，故受制于GC

CheckPoint 时，将状态快照写入到配置的文件系统目录中。

少量的元数据信息存储到 JobManager 的内存中(高可用模式下，将其写入到 CheckPoint 的元数据文件中)

异步快照可防止 CheckPoint 写状态时对数据处理造成阻塞。异步快照默认是开启的

new FsStateBackend(path, false); //可通过编码关闭

FsStateBackend 适用场景：状态较大、窗口较长的 Job和所有高可用的场景。

(3)RocksDBStateBackend【全量/异步快照】：

a、原理：

需配置 URL("hdfs://md:4010/checkpoints" 或 "file:///checkpoints")
正在运行中的状态数据保存在 RocksDB中，RocksDB默认将数据存储在 TaskManager 的数据目录，故RocksDB 的状态量仅受本地磁盘大小的限制。CheckPoint 时，整个 RocksDB被 checkpoint 到配置的文件系统目录中。少量的元数据信息存储到 JobManager 的内存中(高可用模式下，将其存储到 CheckPoint

最低0.47元/天解锁文章

weixin_39862716

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
rocksdb原理_Flink原理—神秘的状态

十万个为什么state、checkpoint、savepoint 之间有什么关系在Flink1.11 中对状态相关的优化有哪些state、checkpoint 、savepoint 存在的意义是什么checkpoint 如何触发、如何设置savepoint和checkpoint的关系State1、定义：与时间相关的任务内部数据的快照2、作用：每次计算需要基于上一次计算的结果，故通过sta...
复制链接

扫一扫