spark的persist算子使用设置Kryo序列化方式

最新推荐文章于 2022-01-21 15:26:16 发布

z小丑八怪r

最新推荐文章于 2022-01-21 15:26:16 发布

阅读量252

点赞数

分类专栏： spark 文章标签： spark 大数据

本文链接：https://blog.csdn.net/weixin_46959672/article/details/111877208

版权

spark 专栏收录该内容

8 篇文章 0 订阅

订阅专栏

spark的persist算子使用

//设置Kryo序列化方式，占用内存小，默认使用java序列化
sc.getConf.set("spark.serializer","org.apache.spark.serializer.KryoSerializer")
val rdd = sc.textFile("hdfs://linux01:8020/data/teacher.log")
import org.apache.spark.storage.StorageLevel
rdd.persist(StorageLevel.MEMORY_ONLY_SER) //只序列化到内存中

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

z小丑八怪r

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
spark的persist算子使用设置Kryo序列化方式

spark的persist算子使用//设置Kryo序列化方式，占用内存小，默认使用java序列化sc.getConf.set("spark.serializer","org.apache.spark.serializer.KryoSerializer")val rdd = sc.textFile("hdfs://linux01:8020/data/teacher.log")import org.apache.spark.storage.StorageLevelrdd.persist(Storage
复制链接

扫一扫