Total size of serialized results of x tasks (x MB) is bigger than spark.driver.maxResultSize (y MB)

最新推荐文章于 2023-10-16 14:24:59 发布

SunnyRivers

最新推荐文章于 2023-10-16 14:24:59 发布

阅读量896

点赞数 1

分类专栏：分析别人的Bug让自己“零”Bug 文章标签： spark maxResultSize bug

本文链接：https://blog.csdn.net/Android_xue/article/details/131930878

版权

分析别人的Bug让自己“零”Bug 专栏收录该内容

15 篇文章 ¥9.90 ¥99.00

订阅专栏

超级会员免费看

本文深入探讨了Spark中的一个常见问题，即`spark.driver.maxResultSize`超限。当序列化结果超过该配置设定的值时，作业会因内存异常而失败。文章解释了序列化的概念，`spark.driver.maxResultSize`的作用，以及它与`driver-memory`的区别。提出了增大`spark.driver.maxResultSize`作为直接解决方案，并引发了关于是否应将大量数据拉取到driver节点的思考。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Bug信息

org.apache.spark.SparkException: Job aborted due to stage failure: Total size of serialized results of x tasks (y MB) is bigger
than spark.driver.maxResultSize (z MB)