spark-textFile的使用

最新推荐文章于 2024-03-07 17:47:04 发布

LittleCookie_

最新推荐文章于 2024-03-07 17:47:04 发布

阅读量1k

点赞数

分类专栏： spark 文章标签： spark

本文链接：https://blog.csdn.net/czw0919/article/details/117650830

版权

spark 专栏收录该内容

17 篇文章 0 订阅

订阅专栏

package com.atguigu.bigdata.spark.core.rdd.builder

import org.apache.spark.rdd.RDD
import org.apache.spark.{SparkConf, SparkContext}

object Spark02_RDD_File {
  def main(args: Array[String]): Unit = {
    // TODO 准备环境
    // local[*] *表示当前系统最大可用核数 如果直接写local表示多线程模拟单核
    val sparkConf = new SparkConf().setMaster("local[*]").setAppName("RDD")
    val sc = new SparkContext(sparkConf)

    // TODO 创建RDD
    // 从文件中创建RDD，将文件中的数据作为处理的数据源

    // path路径默认以当前环境的根路径为基准，可以写绝对路径，也可以写相对路径
    // val rdd: RDD[String] = sc.textFile("datas/1.txt")

    // path路径可以是文件的具体路径，也可以是目录的名称
    // val rdd = sc.textFile("datas")

    // path路径还可以使用通配符 *
    // val rdd = sc.textFile("datas/1*.txt")

    // path还可以是分布式存储系统路径:HDFS
    val rdd = sc.textFile("hdfs:linux1:8020/test.txt")


    rdd.collect().foreach(println)


    // 关闭环境
    sc.stop()
  }
}

LittleCookie_

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
spark-textFile的使用

package com.atguigu.bigdata.spark.core.rdd.builderimport org.apache.spark.rdd.RDDimport org.apache.spark.{SparkConf, SparkContext}object Spark02_RDD_File { def main(args: Array[String]): Unit = { // TODO 准备环境 // local[*] *表示当前系统最大可用核数如果直接写l
复制链接

扫一扫

专栏目录