Spark缓存策略的优化

最新推荐文章于 2024-07-06 09:25:15 发布

IT影风

最新推荐文章于 2024-07-06 09:25:15 发布

阅读量529

点赞数

文章标签： Spark Spark 优化 Spark 缓存优化

本文链接：https://blog.csdn.net/afafawfaf/article/details/81039998

版权

一，Spark缓存优化的方案

class StorageLevel private(
   private var _useDisk:Boolean,//缓存磁盘
   private var _useMemory:Boolean,//缓存内存
   private var _useOffHead:Boolean,//缓存远离堆内存
   private var _deserialized:Boolean,//缓存不序列化
   private var _replication:Int = 1  //保持父本数
)

1，val NONE = new StorageLevel(false,false,false,false)
2，val DISK_ONLY = new StorageLevel(true,false,false,false)
3，val DISK_ONLY_2 = new StorageLevel(true,false,false,false,2)
4，val MEMORY_ONLY = new StorageLevel(false,true,false,true)
5，val MEMORY_ONLY_2 = new StorageLevel(false,true,false,true,2)
6，val MEMORY_ONLY_SER = new StorageLevel(false,true,false,false)
7，val MEMORY_ONLY_SER_2 = new StorageLevel(false,true,false,false,2)
8，val MEMORY_AND_DISK = new StorageLevel(true,true,false,true)
9，val MEMORY_AND_DISK_2 = new StorageLevel(true,true,false,true,2)
10，val MEMORY_AND_DISK_SER = new StorageLevel(true,true,false,false)
11，val MEMORY_AND_DISK_SER_2 = new StorageLevel(true,true,false,false,2)
12，val OFF_HEAP = new StorageLevel(false,false,true,false)

1，是默认的配置

2，仅仅缓存于磁盘

3，仅仅缓存于磁盘并且保持2个副本

4，仅仅缓存于磁盘内存

5，仅仅缓存于磁盘内存并且保持2个副本

6，仅仅缓存于磁盘内存且序列化

7，仅仅缓存于磁盘内存且序列化和保持2个副本

8，缓存于内存满之后，就会缓存于磁盘

9，缓存于内存满之后，就会缓存于磁盘并且保持2个副本

10，缓存于内存满之后，就会缓存于磁盘且序列化

11，缓存于内存满之后，就会缓存于磁盘且序列化，以及保持2个副本

12，缓存远离堆内存