Spark任务一直停在某个Stage不动问题

最新推荐文章于 2024-06-27 12:25:46 发布

巴拉巴拉朵

最新推荐文章于 2024-06-27 12:25:46 发布

阅读量1.2w

点赞数 2

分类专栏：机器学习 Spark 文章标签： Spark任务卡住任务推测执行

本文链接：https://blog.csdn.net/whgyxy/article/details/88779965

版权

Spark 同时被 2 个专栏收录

17 篇文章 0 订阅

订阅专栏

机器学习

15 篇文章 0 订阅

订阅专栏

解决Spark莫名卡住问题

有时候Spark任务莫名会在某个Stage卡住，然后一直停在那里，如果任务重新跑的话又是没有问题的，在实际项目中如果这样的任务出现了，需要仔细分析Spark的log，这样的情况一般是数据不均衡导致的某个节点任务量偏大，而这个节点分配不到太多内存（其他还有很多任务都在这里运行）导致任务卡顿。有几个参数非常有效，主要是Spark的任务推测执行参数，任务推测执行默认是不开启的，因为开启了是会浪费资源的，如果经常有任务卡顿，需要添加这个参数

参数名	默认值	含义
spark.speculation	False	以下几个参数是关于Spark推测执行机制的相关参数。此参数设定是否使用推测执行机制，如果设置为true则spark使用推测执行机制，对于Stage中拖后腿的Task在其他节点中重新启动，并将最先完成的Task的计算结果最为最终结果
spark.speculation.interval	100	Spark多长时间进行检查task运行状态用以推测，以毫秒为单位
spark.speculation.quantile		推测启动前，Stage必须要完成总Task的百分比
spark.speculation.multiplier	1.5	比已完成Task的运行速度中位数慢多少倍才启用推测