package com.atguigu.bigdata.spark.core.rdd.builder
import org.apache.spark.rdd.RDD
import org.apache.spark.{SparkConf, SparkContext}
object Spark01_RDD_Memory {
def main(args: Array[String]): Unit = {
// TODO 准备环境
// local[*] *表示当前系统最大可用核数 如果直接写local表示多线程模拟单核
val sparkConf = new SparkConf().setMaster("local[*]").setAppName("RDD")
val sc = new SparkContext(sparkConf)
// TODO 创建RDD
// 从内存中创建RDD,将内存中集合的数据作为处理的数据源
val seq = Seq(1, 2, 3, 4)
// parallelize表示并行(核数决定) ,parallelize 不好记所以spark提供了makeRDD
// val rdd: RDD[Int] = sc.parallelize(seq)
// makeRDD的底层调用的还是rdd对象的parallelize方法
val rdd: RDD[Int] = sc.makeRDD(seq)
rdd.collect().foreach(println)
// 关闭环境
sc.stop()
}
}
spark-创建第一个RDD
最新推荐文章于 2023-07-25 16:00:00 发布