Spark学习之路（十一）SparkCore的调优之Spark内存模型

最新推荐文章于 2023-03-04 15:46:18 发布

王知无(import_bigdata)

最新推荐文章于 2023-03-04 15:46:18 发布

阅读量405

点赞数

分类专栏： Spark系统性学习专栏文章标签： spark java big data

原创文章禁止转载。否则追究法律后果。

本文链接：https://blog.csdn.net/u013411339/article/details/113796945

版权

Spark系统性学习专栏专栏收录该内容

30 篇文章 8 订阅 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

《2021年最新版大数据面试题全面开启更新》

欢迎关注github《大数据成神之路》

目录

一、概述
二、堆内和堆外内存规划
2.1　堆内内存
2.2　堆外内存
2.3　内存管理接口
三、内存空间分配
3.1　静态内存管理
3.2　统一内存管理
四、存储内存管理
4.1　RDD 的持久化机制
4.2　RDD 缓存的过程
4.3　淘汰和落盘
五、执行内存管理
5.1　多任务间内存分配
5.2　Shuffle 的内存占用

正文

一、概述

Spark 作为一个基于内存的分布式计算引擎，其内存管理模块在整个系统中扮演着非常重要的角色。理解 Spark 内存管理的基本原理，有助于更好地开发 Spark 应用程序和进行性能调优。本文旨在梳理出 Spark 内存管理的脉络，抛砖引玉，引出读者对这个话题的深入探讨。本文中阐述的原理基于 Spark 2.1 版本，阅读本文需要读者有一定的 Spark 和 Java 基础，了解 RDD、Shuffle、JVM 等相关概念。

在执行 Spark 的应用程序时，Spark 集群会启动 Driver 和 Executor 两种 JVM 进程，前者为主控进程，负责创建 Spark 上下文，提交 Spark 作业（Job）࿰

了解本专栏

超级会员免费看

王知无(import_bigdata)

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
Spark学习之路（十一）SparkCore的调优之Spark内存模型

《2021年最新版大数据面试题全面开启更新》欢迎关注github《大数据成神之路》目录一、概述二、堆内和堆外内存规划2.1　堆内内存2.2　堆外内存2.3　内存管理接口三、内存空间分配3.1　静态内存管理3.2　统一内存管理四、存储内存管理4.1　RDD 的持久化机制4.2　RDD 缓存的过程4.3　淘汰和落盘五、执行内存管理5.1　多任务间内存分配5.2　Shuffle 的内存占用正文一、概述Spark 作为一个基于内存的分布式计算引擎，其内存管理模块
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

王知无(import_bigdata) 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。