spark中保存文件的三种方法

最新推荐文章于 2024-06-04 12:29:25 发布

白玉青峰

最新推荐文章于 2024-06-04 12:29:25 发布

阅读量2.8k

点赞数

分类专栏： spark 文章标签： spark

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ZZZ_com/article/details/108873710

版权

spark 专栏收录该内容

8 篇文章 0 订阅

订阅专栏

package com.zyc.spark

import org.apache.spark.{SparkConf, SparkContext}

/**
* Created with IntelliJ IDEA.
* Author: zyc2913@163.com
* Date: 2020/9/28 15:56
* Version: 1.0
* Description:文件保存方式
*/
object StudySave {
def main(args: Array[String]): Unit = {

//spark环境创建
    val conf = new SparkConf()
      .setMaster("local[2]") //设置本机的两个核心
      .setAppName("demo7")
    val sc = new SparkContext(conf)

    /**
     * 1. saveAsTextFile() 将RDD的数据保存到文本文件,对于每个元素，Spark将会调用toString方法，将它转换为文件中的文本
     */
    val rdd = sc.makeRDD(1 to 10)
    rdd.repartition(1)
     // .saveAsTextFile("C:\\Users\\Administrator\\Desktop\\book\\output")

    /**
     * 2. saveAsSequenceFile() 将RDD的数据保存到序列文件,将数据集中的元素以Hadoop sequencefile的格式保存到指定的目录下，可以使HDFS或者其他Hadoop支持的文件系统。
     */

    /**
     * 3. saveAsObjectFile() 将RDD保存在对象文件,用于将RDD中的元素序列化成对象，存储到文件中。
     * 如果不设置分区数，那么默认是几个分区就会生成几个文件
     */
      rdd.saveAsObjectFile("C:\\Users\\Administrator\\Desktop\\book\\output")
}

}

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
spark中保存文件的三种方法

package com.zyc.sparkimport org.apache.spark.{SparkConf, SparkContext}/*** Created with IntelliJ IDEA.* Author: zyc2913@163.com* Date: 2020/9/28 15:56* Version: 1.0* Description:文件保存方式*/object StudySave { def main(args: Array[String]): Unit = .
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。