【Spark】A Step-by-step Guide for Debugging Memory Leaks in Spark Applications

本文提供了一步一步排查Spark应用程序内存泄漏问题的方法。通过实例分析,解释了当任务每三天崩溃一次的情况,可能是内存泄漏导致,建议检查是否遗漏了关闭连接的操作。文章适合开发者自我诊断Spark内存问题。
摘要由CSDN通过智能技术生成

翻译自 Databricks 的博客: https://databricks.com/blog/2020/12/16/a-step-by-step-guide-for-debugging-memory-leaks-in-spark-applications.html

这篇文章是翻译 Databricks 的一篇博客,这是一篇很不错的文章,看完之后,大家基本可以靠自己一步一步地去发现 Spark 应用内存泄漏的原因了,这里就不做完整的翻译了,根据大纲大概解读一下。

This job kept on crashing approximately every 3 days.

任务每三天 Crash 一次,这里就很典型的内存泄漏的问题了,内存泄漏就好比是垃圾桶一样,每天制造一点垃圾,垃圾桶就会慢慢满了。如果第一下看代码没看到,就注意一下是不是什么连接没有 close() 之类的。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值