运行Spark常见问题处理方法（持续更新中......）

最新推荐文章于 2024-04-18 21:03:46 发布

Fortuna_i

最新推荐文章于 2024-04-18 21:03:46 发布

阅读量3.9k

点赞数 2

分类专栏： Spark 文章标签： Spark 机器学习算法常见错误异常

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Fortuna_i/article/details/80648746

版权

1.MaxResultSize问题

首先，出现这个错误的时候Spark会产生如下错误信息：

org.apache.spark.SparkException: Job aborted due to stage failure: Total size of serialized results of 77 tasks (1028.5 MB) is bigger than spark.driver.maxResultSize (1024.0 MB)

而后，继而会出现异常信息：java.lang.InterruptedException

这就是由于设置MaxResultSize这个参数过小而导致的，由上面信息可以看出Spark默认的MaxResultSize大小为1GB，所以解决这类错误的方法就是增大MaxResultSize。

解决方法：在设置SparkConf，即设置Spark参数时加入如下内容：

.set("spark.driver.maxResultSize", "4g")

2.Java heap space问题

内存溢出问题，异常信息为：Exception in thread "main" java.lang.OutOfMemoryError: Java heap space

之后会罗列出现此异常的代码位置信息，从根源开始，从上往下逐步罗列由此方法或者变量而导致后续出现的从小到大异常，简而言之，异常出现的根源是在此异常信息下的头一行语句中。

解决此类问题的方法有三：

（1）调整所用eclipse或者IDEA等软件设置的基础内存大小（ec

最低0.47元/天解锁文章

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
2
评论
运行Spark常见问题处理方法（持续更新中......）

1.MaxResultSize问题首先，出现这个错误的时候Spark会产生如下错误信息：org.apache.spark.SparkException: Job aborted due to stage failure: Total size of serialized results of 77 tasks (1028.5 MB) is bigger than spark.driver....
复制链接

扫一扫

专栏目录

Fortuna_i CSDN认证博客专家 CSDN认证企业博客

码龄7年

上海市岩土工程检测中心

46: 原创

5万+: 周排名

177万+: 总排名

17万+: 访问

: 等级

1969: 积分

64: 粉丝

167: 获赞

48: 评论

411: 收藏

私信

关注

热门文章

分类专栏

项目管理 1篇
数据分析 1篇
SparkCL 10篇
个人介绍 1篇
Spark 25篇
Aparapi
Scala 2篇
GPU 5篇
Consideration 5篇
Java 3篇
SparkCL 3篇
Linux 2篇

最新评论

Scala数据类型转换
菜菜的大数据开发之路: 少年,我看你骨骼精奇,不如来我博客看看可好
SSH框架源码分析
柠檬树上柠檬果柠檬树下你和我: 大家都叫我酸狗
SSH框架源码分析
Fortuna_i: 你这个名字。。。
SSH框架源码分析
柠檬树上柠檬果柠檬树下你和我: 博主的文章真是干货满满！支持！欢迎回访指导！
项目管理知识理论落地实践
Fortuna_i: 第二个资源上传的时候被和谐了，可能是阿里巴巴代码规范或者高级信息系统管理师课程之类的涉及到版权问题，大家理解一下。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。