Spark基础(4):当你df.cache()时,你在cache啥?
Spark源码学习系列(4):Spark存储大揭密Spark存储级别Spark存储级别存储级别描述NONE不进行数据存储MEMORY_ONLY存储到内存中(cache的级别)MEMORY_AND_DISK优先存储到存储中,内存不足,磁盘存储MEMORY_ONLY_SER将RDD中的数据进行序列化,RDD的每个partition会被序列化成一个字节数组MEMORY_AND_DISK_SER超出内存的分区存储到磁盘上DISK_ONLY存储到磁盘上
复制链接