java.io.NotSerializableException: com.hxk.spark.session.TrackerLog
未对TrackerLog进行序列化
在运行下面的代码的时候报错:java.io.NotSerializableException
//2.解析rawRDD每一行原始日志数据
val parsedLogRDD: rdd.RDD[Option[TrackerLog]] = rawRDD.map(line => RawLogParser.parse(line) )
parsedLogRDD.collect().foreach(println)
原因是 :未对TrackerLog进行序列化, spark在计算的时候需要进行网络传输在driver端与excutor端
让TrackerLog这个Java类 实现Serializable接口:
未完全解决,这个TrackerLog是通过插件将schema转过来的,如果重新compile 又没有实现java.io.Serializable了,
解决方式是使用Java的另外一种序列化机制——kryo
//开启kryo序列化机制
conf.set(“spark.serializer”,“org.apache.spark.serializer.KryoSerializer”)