运行Spark常见问题处理方法(持续更新中......)

本文介绍了在运行Spark过程中遇到的MaxResultSize过大、Java heap space内存溢出以及Relative path错误等问题,提供了详细的解决方法,包括调整SparkConf参数、增大内存分配以及设置Spark缓存目录等。
摘要由CSDN通过智能技术生成

1.MaxResultSize问题

首先,出现这个错误的时候Spark会产生如下错误信息:

org.apache.spark.SparkException: Job aborted due to stage failure: Total size of serialized results of 77 tasks (1028.5 MB) is bigger than spark.driver.maxResultSize (1024.0 MB)

而后,继而会出现异常信息:java.lang.InterruptedException

这就是由于设置MaxResultSize这个参数过小而导致的,由上面信息可以看出Spark默认的MaxResultSize大小为1GB,所以解决这类错误的方法就是增大MaxResultSize。

解决方法:在设置SparkConf,即设置Spark参数时加入如下内容:

.set("spark.driver.maxResultSize", "4g")

2.Java heap space问题

内存溢出问题,异常信息为:Exception in thread "main" java.lang.OutOfMemoryError: Java heap space

之后会罗列出现此异常的代码位置信息,从根源开始,从上往下逐步罗列由此方法或者变量而导致后续出现的从小到大异常,简而言之,异常出现的根源是在此异常信息下的头一行语句中。

解决此类问题的方法有三:

(1)调整所用eclipse或者IDEA等软件设置的基础内存大小(ec

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值