【 RDD持久化】


spark_05_RDD持久化

RDD持久化

rdda => rddb =>rddc    action 
rdda => rddb  =>rdde   action

rddb 持久化操作 =》 调优的

操作:

1.persist() or cache() methods
2.触发action之后 会对rdd数据进行持久化的

总结:

1.cache()  不是action算子 是lazy 是懒加载的
  1. rdda => action job
    rdda => cache => action job => rdd持久化 生效
    rdda => action job rdda的数据从 rdd持久化的地方加载数据

    rdda => rddb => rddc
    rdda => rddb => rdde
    rdda => rddb => rddf

    rddb.cache 之后 rddb之后数据就不用从头开机计算 提升计算效率

    补充:
    对rdd做持久化 就是对rdd里面的分区做持久化

    好处:
    1.much faster 【计算效率】
    2. reuse 复用

cache vs persist 区别:

1.cache底层就是调用 persist算子 
2.spark-core 持久化 默认存储级别:StorageLevel.MEMORY_ONLY

StorageLevel:
private var _useDisk: Boolean,
private var _useMemory: Boolean,
private var _useOffHeap: Boolean,
private var _deserialized: Boolean,
private var _replication: Int = 1

val NONE = new StorageLevel(false, false, false, false)
val DISK_ONLY = new StorageLevel(true, false, false, false)
val DISK_ONLY_2 = new StorageLevel(true, false, false, false, 2)
val DISK_ONLY_3 = new StorageLevel(true

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值