package com.atguigu.bigdata.spark.core.rdd.builder
import org.apache.spark.rdd.RDD
import org.apache.spark.{SparkConf, SparkContext}
object Spark02_RDD_File {
def main(args: Array[String]): Unit = {
// TODO 准备环境
// local[*] *表示当前系统最大可用核数 如果直接写local表示多线程模拟单核
val sparkConf = new SparkConf().setMaster("local[*]").setAppName("RDD")
val sc = new SparkContext(sparkConf)
// TODO 创建RDD
// 从文件中创建RDD,将文件中的数据作为处理的数据源
// path路径默认以当前环境的根路径为基准,可以写绝对路径,也可以写相对路径
// val rdd: RDD[String] = sc.textFile("datas/1.txt")
// path路径可以是文件的具体路径,也可以是目录的名称
// val rdd = sc.textFile("datas")
// path路径还可以使用通配符 *
// val rdd = sc.textFile("datas/1*.txt")
// path还可以是分布式存储系统路径:HDFS
val rdd = sc.textFile("hdfs:linux1:8020/test.txt")
rdd.collect().foreach(println)
// 关闭环境
sc.stop()
}
}
spark-textFile的使用
最新推荐文章于 2024-03-07 17:47:04 发布