java.io.NotSerializableException

java.io.NotSerializableException: com.hxk.spark.session.TrackerLog

未对TrackerLog进行序列化

在运行下面的代码的时候报错:java.io.NotSerializableException

//2.解析rawRDD每一行原始日志数据
val parsedLogRDD: rdd.RDD[Option[TrackerLog]] = rawRDD.map(line => RawLogParser.parse(line)  )
parsedLogRDD.collect().foreach(println)

原因是 :未对TrackerLog进行序列化, spark在计算的时候需要进行网络传输在driver端与excutor端
让TrackerLog这个Java类 实现Serializable接口:在这里插入图片描述
未完全解决,这个TrackerLog是通过插件将schema转过来的,如果重新compile 又没有实现java.io.Serializable了,
解决方式是使用Java的另外一种序列化机制——kryo

//开启kryo序列化机制
conf.set(“spark.serializer”,“org.apache.spark.serializer.KryoSerializer”)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值