saveAsTextFile
def saveAsTextFile(path: String): Unit
def saveAsTextFile(path: String, codec: Class[_ <: CompressionCodec]): Unit
- saveAsTextFile用于将RDD以文本文件的格式存储到文件系统中
- codec参数可以指定压缩的类名
- hdfs://保存到hdfs
-
var rdd1 = sc.makeRDD(1 to 10,2) scala> rdd1.saveAsTextFile("hdfs://oldsix1:9000/data/rdd/") //保存到HDFS scala> rdd1.saveAsTextFile("file:///data/rdd/") //保存到本地 scala> rdd1.saveAsTextFile("hdfs://oldsix1:9000/data/rdd/",classOf[com.hadoop.compression.lzo.LzopCodec]) //指定压缩格式保存
saveAsSequenceFile
- saveAsSequenceFile用于将RDD以SequenceFile的文件格式保存到HDFS上
用法同saveAsTextFile
saveAsObjectFile
def saveAsObjectFile(path: String): Unit
- saveAsObjectFile用于将RDD中的元素序列化成对象,存储到文件中
对于HDFS,默认采用SequenceFile保存
var rdd1 = sc.makeRDD(1 to 10,2) scala> rdd1.saveAsObjectFile("hdfs://oldsix1:9000/data/rdd/")