SparkStreaming之persist缓存

SparkStreaming之缓存

与RDD的缓存类似,DStream也允许用户将数据持久化到内存中,只需要使用DStream.persist()方法,就会自动将DSstream中的数据缓存在内存中,这对需要多次计算的DStream数据是一个很好的优化,对于window操作「比如reduceByWindow,reduceByKeyAndWindow」和state操作算子如「updateStateByKey」,默认就是将数据进行缓存持久化的。

一、对于window算子会自动将数据持久化在内存中,不需要手动调用

二、persist(StorageLevels.MEMORY_ONLY_SER)

对于那些从网络接收的inputStream,类似于kafka、flume、socket,默认的持久化存储级别是MEMORY_AND_DISK_SER_2 来保证容错

与RDD不同的是

DStream的默认持久化级别都是将数据以序列化的形式缓存在内存中

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值