spark任务卡住问题原因之一以及解决方案

最新推荐文章于 2024-03-24 18:25:00 发布

赵小丽-programer

最新推荐文章于 2024-03-24 18:25:00 发布

阅读量6k

点赞数 1

分类专栏： python、pyspark小知识卡片文章标签： spark

本文链接：https://blog.csdn.net/lili555521/article/details/105798781

版权

python、pyspark小知识卡片专栏收录该内容

10 篇文章 0 订阅

订阅专栏

本文探讨了Spark在处理大规模数据集时遇到的任务停滞问题，特别是在pyspark中保存数据时，最后几个stage长时间未完成的情况。分析指出，这是由于Spark的推断执行机制导致，该机制启动多个task并保留率先完成的结果，可能造成资源过度占用。文章建议调整推断执行条件以优化资源利用。

摘要由CSDN通过智能技术生成

文章目录

本文是一个记录文，主要是参考网上的资料
Spark任务一直停在某个Stage不动问题

背景

pyspark 在保存数据时，在最后4-5个stage 任务卡住不动，其他stage 10几分钟完成，这几个2h也没用完成，而且在sparkUI上面发现需要处理的数据0KB，实在是郁闷啊。网上查找资料如下，链接如上：

分析

主要是使用了spark 的推断执行机制，

缺点

开始推断执行，会启动多个task，保留率先完成的结果，因此可能导致占用资源较多。
不过可以将推断执行的条件设置的严苛一点，以缓解资源占用的问题。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

赵小丽-programer

关注关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

记录一次spark的job卡住问题

thinkingPrimeCoder的博客

04-08

1761

现象：线上spark任务出现卡死一直运行不完的问题一：排查步骤 1.查看spark任务执行过程发现有三个task在运行转存失败重新上传取消 2.spark任务参数配置的一个executor三个core，查看task对应的excutor的日志发现当前excutor完成driver分配的上一个(206.0)task后，在执行下一个driver分配的下一个(236.0)task时，日志不再输出，看下图日志可以看到三个worker线程都是一样的在执行driver分配的task时没..

Spark数据倾斜问题+解决方案

诸葛搏毅

12-12

6415

1、数据倾斜数据倾斜指的是，并行处理的数据集中，某一部分（如Spark或Kafka的一个Partition）的数据显著多于其它部分，从而使得该部分的处理速度成为整个数据集处理的瓶颈数据倾斜俩大直接致命后果 1）数据倾斜直接会导致一种情况：Out Of Memory 2）运行速度慢主要是发生在Shuffle阶段。同样Key的数据条数太多了。导致了某个key(下图中的80亿条)所在的Task数据量太大了。远远超过其他Task所处理的数据量一个经验结论是：一般情况下，OOM的原因都是数据倾斜 2、如

参与评论您还未登录，请先登录后发表或查看评论

spark任务一直卡住，问题分析、解决

spark_dev的博客

04-08

8486

项目场景： spark运行中，job一直在执行中，运行过程中会有hdfs, db的交互问题描述：有个同学跟我反映问题，spark运行中，job一直在执行中，executor,driver都在跑，没有任何异常，正常是很快跑完，但跑10min都动不动，很奇怪，让我帮忙看看原因分析：碰到问题，处理问题思路： 1.先确定driver,executor是否正常，从页面看，是正常 2.看看任务在做什么，看看executor的task在干忙什么，通过executor tab把正常运行任务的task对应e

【Spark程序在某个stage的最后一个Task卡住--Duration一直增长】

weixin_45389898的博客

03-19

630

我透泥🐎，先有鸡还是先有蛋呢，你想这个问题能想到你死。不多bb，在我这篇帖子，我只说一种办法，把你正在跑的数据量减少一半（总之就是通过减少数据量来验证是不是内存不足导致Task卡死），然后重新跑Spark任务，成功就是硬件的问题（机器内存不够）；如果不成功那你还是成仁吧。

Spark -- 一次Task长时间卡住不动，一直Running的问题解决

TheBigBlue的博客

07-28

1万+

向导现象排查现象 spark提交任务后，某一个Stage卡住，通过spark界面看到，executor运行正常，卡住的Stage的task已经分配至executor，但task 一直在running并且数据量不大，task不结束，同时log中也无异常报出。 20/07/27 07:40:13 INFO CoarseGrainedExecutorBackend: Started daemon with process name: 15841@ip-10-3-1-141.ec2.internal 20

Spark Streaming写入tsdb卡死问题

jyj019的博客

05-29

531

最近写入程序经常出现写入tsdb卡死问题，经过比较久排查后解决，这里记录下。对我个人而言加深了spark程序和yarn资源管理关系的认知。

Spark任务的某个Stage卡住不动问题

weixin_44455388的博客

09-29

7408

有时候Spark任务莫名会在某个Stage卡住，然后一直停在那里，如果任务重新跑的话又是没有问题的，在实际项目中如果这样的任务出现了，需要仔细分析Spark的log，这样的情况一般是数据不均衡导致的某个节点任务量偏大，而这个节点分配不到太多内存（其他还有很多任务都在这里运行）导致任务卡顿。有几个参数非常有效，主要是Spark的任务推测执行参数，任务推测执行默认是不开启的，因为开启了是会浪费资源的，...

网络原因造成 spark task 卡住

偷闲小苑

05-10

4243

主机名映射出错背景：Yarn集群新加入了一批Spark机器后发现运行Spark任务时，一些task会无限卡住且driver端没有任何提示。解决：进入task卡住的节点查看container stderr日志，发现在获取其他节点block信息时，连接不上其他的机器节点，不停重试。怀疑部分旧节点的/etc/hosts文件被运维更新漏了，查看/etc/hosts，发现没有加入新节点的地址，加入后问

Spark任务偶现Task卡住很长时间导致Stage整体耗时长

独行的卡卡的博客

02-24

1万+

问题现象提交大量Spark任务，概率性出现个别Task卡住一段时间，进而导致Stage整体耗时开销异常。问题分析采样Job836 异常Stage2249 -> 卡住Task8：对应Executor日志： ... INFO | [Executor task launch worker-78] | Running task 8.0 in stage 2249.0 (T...

spark之OOM常见问题梳理(一)

写轮眼之大数据

05-19

2131

我想变成那陪着疲倦的你一直看海的小小的白色的椅子。 —王小波一、Spark报错信息问题一 1.描述 org.apache.spark.shuffle.FetchFailedException 这种问题一般发生在有大量shuffle操作的时候,task不断的failed,然后又重执行，一直循环下去，非常的耗时。图片 2.报错提示 (1) missing output location org.apache.spark.shuffle.MetadataFetchFailedException: Miss

Spark学习总结以及问题

Cc_DaGe的博客

09-10

355

spark 翻译 Apache Spark is a fast and general-purpose cluster computing system. It provides high-level APIs in Java, Scala, Python and R, and an optimized engine that supports general execution graphs. It also supports a rich set of higher-level tools inc

Spark Driver CPU 占用异常问题排查

AI+BI,大数据分析,数据可视化,商业智能,数据驾驶舱 - 观远数据

08-22

893

排查实录

Hadoop与Spark常用配置参数总结

chinabinner的专栏

01-11

567

背景 MapReduce和Spark对外提供了上百个配置参数，用户可以为作业定制这些参数以更快，更稳定的运行应用程序。本文梳理了最常用的一些MapReduce和Spark配置参数。 MapReduce重要配置参数 1. 资源相关参数 (1) mapreduce.map.memory.mb: 一个Map Task可使用的资源上限（单位:MB），默认为1024。如果Map Task实际使用的资

Spark推测执行解决SparkStreaming任务task卡死问题

hongtaq156136的专栏

02-20

2909

Spark推测执行解决SparkStreaming任务task卡死问题景：测试环境运行一个SparkStreaming任务，yarn-cluster模式，duration为5分钟一个批次，每个批次平均2000w条records，并行度为60 资源配置为： ${SPARK_HOME}/bin/spark-submit --name ${jobname} --driver-cores 3 -...

spark程序运行完了但是一直卡住。

cclovezbf的博客

11-17

1603

spark 任务也跑完了，卡在最后，一直没结束。因为我之前开了一个线程池，用完了没关闭。

Spark-bug总结之一次task长时间卡住不动,一直Running的问题解决

一个记录普通男孩在ＩＴ界学习思考感悟的地方

02-28

6043

目录现象排查现象 spark提交任务后，某一个Stage卡住，通过spark界面看到，executor运行正常，卡住的Stage的task已经分配至executor，但task 一直在running并且数据量不大，task不结束，同时log中也无异常报出。 20/07/27 07:40:13 INFO CoarseGrainedExecutorBackend: Started daemon with process name: 15841@ip-10-3-1-141.ec2.i

spark运行正常，某一个Stage卡住，停止不前异常分析

weixin_42340179的博客

09-05

7072

异常说明 spark提交任务后，前N个Stage运行顺利，到达某一个Stage后，卡住，通过spark界面可以看到，executor运行正常，卡住的Stage的task已经分配至executor，但duration time一直增加，task却不结束，同时log中也无异常报出。 解决方案 1，分析没有异常说明程序本身没有问题，框架运行也运行正常，很有可能是因为该stage操作较为复杂...

【大数据生态】HIVE运行卡死没反应