Flink状态管理之savePoint

最新推荐文章于 2024-03-12 23:31:31 发布

Jiny_li

最新推荐文章于 2024-03-12 23:31:31 发布

阅读量1.6k

点赞数

文章标签： Flink

本文链接：https://blog.csdn.net/Jiny_li/article/details/86422912

版权

基本介绍

1、Flink通过Savepoint功能可以做到程序升级后，继续从升级前的那个点开始执行计算，保证数据不中断

2、全局，一致性快照。可以保存数据源offset，operator操作状态等信息

3、可以从应用在过去任意做了savepoint的时刻开始继续消费

checkPoint vs savePoint

checkPoint

•应用定时触发，用于保存状态，会过期

•内部应用失败重启的时候使用

savePoint

•用户手动执行，是指向Checkpoint的指针，不会过期

•在升级的情况下使用

注意：为了能够在作业的不同版本之间以及 Flink 的不同版本之间顺利升级，强烈推荐程序员通过 uid(String) 方法手动的给算子赋予 ID，这些 ID 将用于确定每一个算子的状态范围。如果不手动给各算子指定 ID，则会由 Flink 自动给每个算子生成一个 ID。只要这些 ID 没有改变就能从保存点（savepoint）将程序恢复回来。而这些自动生成的 ID 依赖于程序的结构，并且对代码的更改是很敏感的。因此，强烈建议用户手动的设置 ID。

savePoint的使用

1：在flink-conf.yaml中配置Savepoint存储位置。非必须设置，但是设置后，后面创建指定Job的Savepoint时，可以不用在手动执行命令时指定Savepoint的位置

state.savepoints.dir: hdfs://namenode:9000/flink/savepoints

2：触发一个savepoint【直接触发或者在cancel的时候触发】

bin/flink savepoint jobId [targetDirectory] [-yid yarnAppId]【针对on yarn模式需要指定-yid参数】

bin/flink cancel -s [targetDirectory] jobId [-yid yarnAppId]【针对on yarn模式需要指定-yid参数】

3：从指定的savepoint启动job

bin/flink run -s savepointPath [runArgs]

Jiny_li

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Flink状态管理之savePoint

基本介绍1、Flink通过Savepoint功能可以做到程序升级后，继续从升级前的那个点开始执行计算，保证数据不中断2、全局，一致性快照。可以保存数据源offset，operator操作状态等信息3、可以从应用在过去任意做了savepoint的时刻开始继续消费checkPoint vs savePointcheckPoint•应用定时触发，用于保存状态，会过期•内...
复制链接

扫一扫