spark-checkpoint机制

本文详细介绍了 Spark 中 Checkpoint 的设置流程与读取过程。包括:如何在 Job 完成后判断是否需要进行 Checkpoint 操作;创建 Checkpoint 目录及启动新的 Job 计算;创建 CheckpointRDD 并更新依赖关系;最后介绍了如何从已保存的目录中读取 Checkpoint 数据。
摘要由CSDN通过智能技术生成

设置checkpoint流程

    1.job执行结束后,会判断是否需要checkpint操作

    2.如果需要checkepoint操作,则先创建一个目录,在启动一个新的job计算,并将计算结果写入到创建的目录里面

    3.创建一个checkpointRDD,并将原始的RDD依赖全部删除

    4.将checkpointRDD加入到原始RDD依赖中,并将cpState状态改成checkpointed

读取checkpoint流程:

    1.检查RDD是否呗checkpoint过的

    2.如果check过的则直接从创建的目录里面读取

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值