Spark1.6内存管理(二) 实例讲解：Spark管理页面中Storage Memory是如何计算的？

最新推荐文章于 2023-04-27 12:20:01 发布

wisgood

最新推荐文章于 2023-04-27 12:20:01 发布

阅读量1.1w

点赞数 8

分类专栏： spark 文章标签： java spark spark内存 Spark Spark

本文链接：https://blog.csdn.net/wisgood/article/details/79850540

版权

spark 专栏收录该内容

65 篇文章 0 订阅

订阅专栏

书接上文： https://blog.csdn.net/wisgood/article/details/78069753
本文主要讲解879.0MB是如何算出来的？spark用的是1.6版本。
这里写图片描述
对应程序的参数设置为

spark-shell  --executor-memory 1536M

Storage Memory

该页面显示的Storage Memory 实际是上文中介绍的 Storage Memory 和 Execution Memory的和,是由Spark管理的内存池总和。
即

Storage Memory =(executorMemory-300m)*0.75

根据上面公式，计算出来的Storage Memory=927M(1536-300)*0.75,比显示的879大很多。为什么？

其实程序在计算的时候，用的Storage Memory是通过Runtime.getRuntime.maxMemory拿到的,Runtime.getRuntime.maxMemory是程序能够使用的最大内存，会比executorMemory值小。原因是java新生代中，有2个Survivor，而只有1个是可用的，所以Runtime.getRuntime.maxMemory实际=Eden+Survivor+Old Gen，比设置的内存要小。

为了准确计算Runtime.getRuntime.maxMemory这个值，我们在spark启动的时候，添加一些其他参数,

--conf "spark.executor.extraJavaOptions=-verbose:gc -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintHeapAtGC"

启动命令变成

spark-shell  --executor-memory 1536M --conf "spark.executor.extraJavaOptions=-verbose:gc -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintHeapAtGC"

这样做的目的是在每个executor执行过程中，打印部分gc log。通过这个，我们能比较清楚的知道executor内存中新生代老年代情况。如下图
这里写图片描述

据此我们可以计算Runtime.getRuntime.maxMemory


Runtime.getRuntime.maxMemory=393216 K+65536 K+1048576 K=1472 M

此时再计算hadoop页面中显示的Storage Memory

Storage Memory = 879 M = (1472-300)*0.75

文章为作者原创文章，如果对您有帮助，欢迎打赏！

这里写图片描述

wisgood

关注

8
点赞
踩
13

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录