Exception in thread "main" org.apache.spark.SparkException: Task not serializable异常

最新推荐文章于 2024-04-18 21:03:46 发布

jackliu2013

最新推荐文章于 2024-04-18 21:03:46 发布

阅读量2.6w

点赞数 1

分类专栏： spark

本文链接：https://blog.csdn.net/u010770919/article/details/41441149

版权

spark 专栏收录该内容

10 篇文章 0 订阅

订阅专栏

问题：Exception in thread "main" org.apache.spark.SparkException: Task not serializable异常

问题原因：

所生成的任务对象需要序列化，以便的不同的节点进行传输，保证数据的正确性。

Java 串行化技术可以使你将一个对象的状态写入一个Byte 流里，并且可以从其它地方把该Byte 流里的数据读出来，重新构造一个相同的对象。这种机制允许你将对象通过网络进行传播，并可以随时把对象持久化到数据库、文件等系统里。Java的串行化机制是RMI、EJB等技术的技术基础。用途：利用对象的串行化实现保存应用程序的当前工作状态，下次再启动的时候将自动地恢复到上次执行的状态。

序列化就是一种用来处理对象流的机制，所谓对象流也就是将对象的内容进行流化。可以对流化后的对象进行读写操作，也可将流化后的对象传输于网络之间。序列化是为了解决在对对象流进行读写操作时所引发的问题。

序列化的实现：将需要被序列化的类实现Serializable接口，然后使用一个输出流(如：FileOutputStream)来构造一个ObjectOutputStream(对象流)对象，接着，使用ObjectOutputStream对象的writeObject(Object obj)方法就可以将参数为obj的对象写出(即保存其状态)，要恢复的话则用输入流。

以上内容来自于：http://blog.csdn.net/yakihappy/article/details/3979373

解决方案：

Scala的object和class需要实现接口 Serializable

/**
* constructor the object
*/
objectLewa_device_report extendsSerializable {}

/**
* @author Administrator
* filepath : String
* originalfileRDD : org.apache.spark.rdd.RDD[StringBuffer]
* sqlcontext :org.apache.spark.sql.SQLContext
*/
class Lewa_device_report( var filepath:String, val sparkcontext:org.apache.spark.SparkContext,val sqlcontext:org.apache.spark.sql.SQLContext)extends Serializable{}

查看一下API文档

关于SparkContext