rdd数据存内存数据量_为缓存的RDD分配了多少内存？

最新推荐文章于 2022-03-15 15:49:35 发布

qqc1024

最新推荐文章于 2022-03-15 15:49:35 发布

阅读量369

点赞数

文章标签： rdd数据存内存数据量

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_36248747/article/details/113522066

版权

本文探讨了一个拥有5节点Spark集群的问题，每个节点6GB内存却频繁内存溢出。作者分析了RDD缓存占用情况，并提供了关于如何调整Spark.yarn.executor.memoryOverhead以解决ExecutorLostFailure问题的建议。

摘要由CSDN通过智能技术生成

我有一个5工作节点集群，每个集群有6 GB的内存(Spark执行程序内存设置为4608 GB) .

我一直在耗尽内存，Spark告诉我，我的一个 Actuator 试图使用更多的5.0 GB内存 . 如果每个执行程序获得5 GB的内存，那么我的整个集群之间应该有25 GB的内存 .

ExecutorLostFailure (executor 4 exited caused by one of the running tasks)

Reason: Container killed by YARN for exceeding memory limits. 5.0 GB of 5.0

GB physical memory used. Consider boosting spark.yarn.executor.memoryOverhead.

在我的spark应用程序开始时，当我在Storage选项卡中查看我的一个RDD时(此时它是缓存中唯一的rdd)，我看到：

RDD Name Storage Level Cached Partitions Fraction Cached Size in Memory Size on Disk

myRDD Memory Serialized 1x Replicated 20 100% 3.2 GB 0.0 B

Host On Heap Memory Usage Off Heap Memory Usage Disk Usage

Node 1 643.5 MB (1931.3 MB Remaining) 0.0 B (0.0 B Remaining) 0.0 B

Master 0.0 B (366.3 MB Remaining) 0.0 B (0.0 B Remaining) 0.0 B

Node 2 654.8 MB (1920.0 MB Remaining) 0.0 B (0.0 B Remaining) 0.0 B

Node 3 644.2 MB (1930.6 MB Remaining) 0.0 B (0.0 B Remaining) 0.0 B

Node 4 656.2 MB (1918.6 MB Remaining) 0.0 B (0.0 B Remaining) 0.0 B

Node 5 652.4 MB (1922.4 MB Remaining) 0.0 B (0.0 B Remaining) 0.0 B

这似乎表明每个节点只有大约2.5 GB的可用内存 . 在我的spark应用程序出现内存不足错误之前，存储选项卡也永远不会接近显示25 GB的缓存RDD .

我如何知道为缓存的RDD分配了多少内存？

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。