设置checkpoint流程
1.job执行结束后,会判断是否需要checkpint操作
2.如果需要checkepoint操作,则先创建一个目录,在启动一个新的job计算,并将计算结果写入到创建的目录里面
3.创建一个checkpointRDD,并将原始的RDD依赖全部删除
4.将checkpointRDD加入到原始RDD依赖中,并将cpState状态改成checkpointed
读取checkpoint流程:
1.检查RDD是否呗checkpoint过的
2.如果check过的则直接从创建的目录里面读取
本文详细介绍了 Spark 中 Checkpoint 的设置流程与读取过程。包括:如何在 Job 完成后判断是否需要进行 Checkpoint 操作;创建 Checkpoint 目录及启动新的 Job 计算;创建 CheckpointRDD 并更新依赖关系;最后介绍了如何从已保存的目录中读取 Checkpoint 数据。
303

被折叠的 条评论
为什么被折叠?



