数据缓存和checkpoint的用法、存储与读取过程确实很相似,但也有不少区别,下面总结说明一下。
(
1
)目的不同。数据缓存的目的是加速计算,即加速后续运行的job。而
checkpoint
的目的是在
job
运行失败后能够快速恢复,也就是说加速当前需要重新运行的job
。
(
2
)存储性质和位置不同。数据缓存是为了读写速度快,因此主要使用内存,偶尔使用磁盘作为存储空间。而checkpoint
是为了能够可靠读写,因此主要使用分布式文件系统作为存储空间。
(
3