spark从入门到放弃五十三:Spark Streaming(13)缓存于持久化

最新推荐文章于 2021-05-10 00:25:54 发布

WQ同学

最新推荐文章于 2021-05-10 00:25:54 发布

阅读量3.8k

点赞数

分类专栏： spark-streaming spark 文章标签： spark 开发人员缓存数据内存

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012957549/article/details/80233596

版权

spark 同时被 2 个专栏收录

122 篇文章 15 订阅

订阅专栏

spark-streaming

12 篇文章 1 订阅

订阅专栏

与RDD 类似，spark Streaming 也可以让开发人员手动控制，将数据流中的数据持久化到内存中。对DStream 调用persist ( ) 方法，就可以让spark Streaming 自动将该数据流中的所有产生的RDD 都持久化到内存中。如果要对于一个DStream 多次执行操作，那么对DStream 持久化是非常有用的。因为多次操作，可以共享一份数据。
对于基于窗口的操作，例如reduceBywindow 等以及基于状态的操作，比如updateStateKey ,默认就开启了持久化的机制。即spark streaming 默认就会将上述操作产生的DStream 中的数据，缓存内存中，不需要开发人员手动调用peisist 方法
对于通过网络接收数据的输入流，比如socket ，kafka flume 等持久化级别是将数据复制一份，已便于容错。相当于是用的类似MEMORY_ONLY_SER_2
与RDD 不同的是，默认的持久化级别，统一都是要序列化的。

欢迎关注，更多惊喜等着你

这里写图片描述

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
spark从入门到放弃五十三:Spark Streaming(13)缓存于持久化

与RDD 类似，spark Streaming 也可以让开发人员手动控制，将数据流中的数据持久化到内存中。对DStream 调用persist ( ) 方法，就可以让spark Streaming 自动将该数据流中的所有产生的RDD 都持久化到内存中。如果要对于一个DStream 多次执行操作，那么对DStream 持久化是非常有用的。因为多次操作，可以共享一份数据。对于基于窗
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。