【Spark】RDD缓存机制

卜塔

已于 2023-04-13 23:12:13 修改

阅读量634

点赞数

分类专栏： Spark 文章标签：缓存 spark 大数据

于 2023-04-12 11:42:34 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/NextAction/article/details/130102783

版权

Spark 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

1. RDD缓存机制是什么？

把RDD的数据缓存起来，其他job可以从缓存中获取RDD数据而无需重复加工。

2. 如何对RDD进行缓存？

有两种方式，分别调用RDD的两个方法：persist 或 cache。
注意：调用这两个方法后并不会立刻缓存，而是有action算子触发时才会缓存。

3. persist 和 cache有什么区别？

二者的区别在于缓存级别上：
persist有多种缓存方式，如缓存到内存，缓存到磁盘等。
cache只缓存到内存，且实际是调用了persist方法。
两种方法的源码及缓存RDD的缓存级别如下：
在这里插入图片描述

4. 何时需要缓存RDD？

有两种情况：

RDD被后续多个job用到；
RDD的计算过程复杂。

5. 如何清除RDD缓存？

有两种方式：

应用程序结束后，缓存自动清除；
调用unpersist方法，源码如下：

–The End–

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
【Spark】RDD缓存机制

把RDD的数据缓存起来，其他job可以从缓存中获取RDD数据而无需重复加工。注意：调用这两个方法后并不会立刻缓存，而是有action算子触发时才会缓存。persist有多种缓存方式，如缓存到内存，缓存到磁盘等。cache只缓存到内存，且实际是调用了persist方法。
复制链接

扫一扫

专栏目录

卜塔 CSDN认证博客专家 CSDN认证企业博客

码龄7年

318: 原创

3万+: 周排名

93万+: 总排名

85万+: 访问

: 等级

9910: 积分

131: 粉丝

191: 获赞

42: 评论

749: 收藏

私信

关注

热门文章

分类专栏

IDEA 1篇
Oracle 77篇
PL/SQL 14篇
SQL 30篇
PostgreSQL 29篇
MySQL 4篇
Python 36篇
Shell 5篇
Java 2篇
Kettle 9篇
Hadoop 16篇
Hive 23篇
HBase 2篇
Flume 2篇
Spark 6篇
Kafka 7篇
Sqoop 2篇
Flink
Linux 26篇
数据仓库 6篇
数据分析 5篇
Excel 8篇
Maven 1篇
C 1篇
汇编语言 1篇

最新评论

【SQL】SQL语句执行顺序
CSDN-Ada助手: 推荐 MySQL入门技能树：https://edu.csdn.net/skill/mysql?utm_source=AI_act_mysql
【Python3】复制、移动、删除文件及文件夹
Molliojing: 原来复制文件和复制文件夹是不一样的，受教了！
【SQL】正则表达式-校验数字，字符，特殊需求等
qq_46075194: 引用「^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$」这个用不了，显示有invalid character range
【Hive】UDF、UDAF
CSDN-Ada助手: 非常感谢您分享关于Hive UDF和UDAF的博客！这是一个非常有价值的主题，让我们了解到更多关于Hive的使用技巧。我个人非常期待您写一篇关于Hive中的分区和桶的博客，这两个特性是Hive优化和加速查询的关键。您可以分享如何在Hive中分配分区和桶、如何利用这些特性优化查询性能等内容。期待您的下一篇博客！ 2023年博客之星「城市赛道」年中评选已开启（https://activity.csdn.net/creatActivity?id=10470&utm_source=blog_comment_city ），博主的原力值在所在城市已经名列前茅，持续创作就有机会成为所在城市的 TOP1 博主（https://bbs.csdn.net/forums/blogstar2023?typeId=3152981&utm_source=blog_comment_city），更有丰厚奖品等你来拿~。
【Python】检测字符串的方法
m0_69017437: 有无检测既不是数字也不是字母的函数啊

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。