
1,Spark RDD如果其中的RDD计算错误,重算它会找与之前的RDD
2,Spark RDD如果RDD做了缓存策略,计算错误的RDD重算就会从缓存里面找
3,Spark RDD如果Lineage过长对RDD做doCheckpoint(),计算错误的RDD重算就会从磁盘里面找到
本文介绍了Spark中RDD的三种错误恢复方式:1. 当RDD计算出错时,通过其依赖关系重新计算;2. 当设置了缓存策略的RDD计算出错时,从缓存中查找数据;3. 当Lineage过长时,使用doCheckpoint()方法将RDD的状态保存到磁盘,以便在计算出错时快速恢复。

1,Spark RDD如果其中的RDD计算错误,重算它会找与之前的RDD
2,Spark RDD如果RDD做了缓存策略,计算错误的RDD重算就会从缓存里面找
3,Spark RDD如果Lineage过长对RDD做doCheckpoint(),计算错误的RDD重算就会从磁盘里面找到
606
786

被折叠的 条评论
为什么被折叠?