Spark任务偶现Task卡住很长时间导致Stage整体耗时长

本文分析了Spark任务中偶现Task卡住导致Stage耗时过长的问题,通过对Job836的采样,发现由于Executor所在NodeManager的内存耗尽和频繁Full GC,造成Task执行延迟。解决方案是调整NodeManager的堆内存设置,以适应业务需求。
摘要由CSDN通过智能技术生成

原始文章链接:https://alphablacktan.github.io/bigdata/2018/08/13/Spark任务偶现Task卡住很长时间导致Stage整体耗时长/

问题现象

提交大量Spark任务,概率性出现个别Task卡住一段时间,进而导致Stage整体耗时开销异常。

问题分析

采样Job836

异常Stage2249 -> 卡住Task8:

对应Executor日志:

...
INFO | [Executor task launch worker-78] | Running task 8.0 in stage 2249.0 (TID 222920) | org.apache.spark.Logging$class.logInfo(Logging.scala:59)
ERROR | [shuffle-client-1] | Connection is dead; please adjust spark.network.timeout if this is wrong | org.apache.spark.network.server.TransportChannelHandler.userEventTriggered(TransportChannelHandler.java:128)
ERROR | [shuffle-client-1] |
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值