Spark没有设置序列化导致提交任务问题

最新推荐文章于 2023-12-16 12:19:40 发布

jim8973

最新推荐文章于 2023-12-16 12:19:40 发布

阅读量366

点赞数

分类专栏： spark

本文链接：https://blog.csdn.net/jim8973/article/details/102760975

版权

spark 专栏收录该内容

8 篇文章 0 订阅

订阅专栏

**org.apache.spark.SparkException: Job aborted due to stage failure: Task 0.0 in stage 2.0 (TID 2) had a not serializable result:

object not serializable (class: org.apache.hadoop.hbase.io.ImmutableBytesWritable, value: 7a 68 61 6e 67 73 61 6e)
- field (class: scala.Tuple2, name: _1, type: class java.lang.Object)
- object (class scala.Tuple2, (7a 68 61 6e 67 73 61 6e,keyvalues={lisi/course:chinese/1434685460521/Put/vlen=2/mvcc=0, lisi/course:english/1434698883293/Put/vlen=2/mvcc=0, lisi/course:math/1434685470168/Put/vlen=2/mvcc=0}))
- element of array (index: 0)
- array (class [Lscala.Tuple2;, size 2)
at org.apache.spark.scheduler.DAGScheduler.org $a p a c h e$ spark $s c h e d u l e r$ DAGScheduler $f a i l J o b A n d I n d e p e n d e n t S t a g e s (D A G S c h e d u l e r . s c a l a : 1204) a t o r g . a p a c h e . s p a r k . s c h e d u l e r . D A G S c h e d u l e r$ anonfun$abortStage $1 . a p p l y (D A G S c h e d u l e r . s c a l a : 1193) a t o r g . a p a c h e . s p a r k . s c h e d u l e r . D A G S c h e d u l e r$ $a n o n f u n$ abortStage $1 . a p p l y (D A G S c h e d u l e r . s c a l a : 1192) a t s c a l a . c o l l e c t i o n . m u t a b l e . R e s i z a b l e A r r a y$ class.foreach(ResizableArray.scala:59)
at scala.collection.mutable.ArrayBuffer.foreach(ArrayBuffer.scala:47)
at org.apache.spark.scheduler.DAGScheduler.abortStage(DAGScheduler.scala:1192)
at org.apache.spark.scheduler.DAGScheduler $KaTeX parse error: Can't use function '$' in math mode at position 8: anonfun$̲handleTaskSetFa\dots$ anonfun$handleTaskSetFailed $1 . a p p l y (D A G S c h e d u l e r . s c a l a : 693) a t s c a l a . O p t i o n . f o r e a c h (O p t i o n . s c a l a : 236) a t o r g . a p a c h e . s p a r k . s c h e d u l e r . D A G S c h e d u l e r . h a n d l e T a s k S e t F a i l e d (D A G S c h e d u l e r . s c a l a : 693) a t o r g . a p a c h e . s p a r k . s c h e d u l e r . D A G S c h e d u l e r E v e n t P r o c e s s L o o p . o n R e c e i v e (D A G S c h e d u l e r . s c a l a : 1393) a t o r g . a p a c h e . s p a r k . s c h e d u l e r . D A G S c h e d u l e r E v e n t P r o c e s s L o o p . o n R e c e i v e (D A G S c h e d u l e r . s c a l a : 1354) a t o r g . a p a c h e . s p a r k . u t i l . E v e n t L o o p$ $anon$1.run(EventLoop.scala:48)**
解决方法，在SparkConf上set序列化：
val sconf = new SparkConf()
.setMaster(“spark://h230:7077”)
.setAppName(“SparkFromHbase”)
.set(“spark.executor.memory”, “1g”)
.set(“spark.serializer”, “org.apache.spark.serializer.KryoSerializer”)

jim8973

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Spark没有设置序列化导致提交任务问题

**org.apache.spark.SparkException: Job aborted due to stage failure: Task 0.0 in stage 2.0 (TID 2) had a not serializable result:object not serializable (class: org.apache.hadoop.hbase.io.ImmutableB...
复制链接

扫一扫