spark任务报错：org.apache.spark.shuffle.FetchFailedException: Failed to connect to tjtx148-6-173.58os.org

最新推荐文章于 2022-07-25 09:00:43 发布

攻城狮Kevin

最新推荐文章于 2022-07-25 09:00:43 发布

阅读量1.3k

点赞数

分类专栏： Spark 文章标签： spark

本文链接：https://blog.csdn.net/wx1528159409/article/details/101015967

版权

Spark 专栏收录该内容

47 篇文章 7 订阅

订阅专栏

org.apache.spark.shuffle.FetchFailedException: Failed to connect to tjtx148-6-173.58os.org:7337

org.apache.spark.shuffle.FetchFailedException: Failed to connect to tjtx148-6-173.58os.org:7337
	at org.apache.spark.storage.ShuffleBlockFetcherIterator.throwFetchFailedException(ShuffleBlockFetcherIterator.scala:529)
	at org.apache.spark.storage.ShuffleBlockFetcherIterator.next(ShuffleBlockFetcherIterator.scala:460)
	at org.apache.spark.storage.ShuffleBlockFetcherIterator.next(ShuffleBlockFetcherIterator.scala:62)
	at scala.collection.Iterator$$anon$12.nextCur(Iterator.scala:434)
	at scala.collection.Iterator$$anon$12.hasNext(Iterator.scala:440)
	at scala.collection.Iterator$$anon$11.hasNext(Iterator.scala:408)
	at org.apache.spark.util.CompletionIterator.hasNext(CompletionIterator.scala:30)
	at org.apache.spark.InterruptibleIterator.hasNext(InterruptibleIterator.scala:37)
	at scala.collection.Iterator$$anon$12.hasNext(Iterator.scala:438)
	at scala.collection.Iterator$$anon$11.hasNext(Iterator.scala:408)
	at org.elasticsearch.spark.rdd.EsRDDWriter.write(EsRDDWriter.scala:66)
	at org.elasticsearch.spark.rdd.EsSpark$$anonfun$doSaveToEs$1.apply(EsSpark.scala:107)
	at org.elasticsearch.spark.rdd.EsSpark$$anonfun$doSaveToEs$1.apply(EsSpark.scala:107)
	at org.apache.spark.scheduler.ResultTask.runTask(ResultTask.scala:89)
	at org.apache.spark.scheduler.Task.run(Task.scala:111)
	at org.apache.spark.executor.Executor$TaskRunner.run(Executor.scala:365)
	at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1142)
	at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:617)
	at java.lang.Thread.run(Thread.java:745)
Caused by: java.io.IOException: Failed to connect to tjtx148-6-173.58os.org:73

该报错是因为spark程序从HDFS抽取数据时，hadoop节点tjtx148-6-173.58os.org:7337宕机导致，宕机后会去找该节点数据的副本存储节点，retry任务。

spark中blacklieted黑名单中显示false，以为此节点宕机后不会将其加入黑名单。（正常spark程序遇到某台hadoop节点宕机后会将其加入黑名单）

攻城狮Kevin

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
spark任务报错：org.apache.spark.shuffle.FetchFailedException: Failed to connect to tjtx148-6-173.58os.org

org.apache.spark.shuffle.FetchFailedException: Failed to connect to tjtx148-6-173.58os.org:7337org.apache.spark.shuffle.FetchFailedException: Failed to connect to tjtx148-6-173.58os.org:7337 at or...
复制链接

扫一扫

专栏目录