SavePoint 和 CheckPoint的区别:
checkpoint提供一种轻量级和快速恢复机制,整个生命周期由Flink框架管理,作业程序在运行期间不允许变更,任务执行结束后会删除checkpoint数据,除非显式配置保留checkpoint。
SavePoint 的创建 持有 删除 都由用户来控制,手动来实现备份和恢复,可以在用户变更 job graph,修改并行度,fork代码时候恢复,从原理上来说,SavePoint的成本会高一些,更关注程序在移植,变更之后的恢复。
当前(Flink 1.8)实现的checkpoint和savepoint基本使用了相同的代码和生成相同的数据格式文件,之后可能会引入更多的差异,checkpoint可以使用 于RockDB的backend实现更轻量级的增量存储。