Spark学习笔记:奇怪的Serializable(待填坑~

慢慢摸索了有段时间啦,有个问题一直不是特别懂,就是在执行作业的时候,有时候会抛出task not serializable的异常,就是rdd的map之类的操作时引用了外部的变量。

之前也查过很多次了,原因大概理解,task从driver节点分发到子节点计算的时候,会先序列化,子节点收到后反序列化,所以出现异常时有几种解决方案,或者将class extends java.io.Serializable,或者用val(好像在哪看到过说val是默认支持序列化的?记不清了),或者把不能序列化的部分使用transient关键字修饰,之类的。

  解决方法很多啦,然后最近写了一个这种东西:

trait CommonData extends java.io.Serializable {
...
}
trait CommonLogData extends CommonData {
	def doSomething(rdd :RDD[SampleData]):RDD[SampleData] = {
	...
	}
}
object SampleData extends CommonLogData{
	def method():Unit={
		...
		list.foreach(rdd => doSomething(rdd))
	}
}
然后就抛异常啦~ 写的不是特别全,但大概是这样子的,还没搞懂为什么这样会抛异常。难道SampleData不是可以序列化的嘛?待填坑~~

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值