spark-创建第一个RDD

最新推荐文章于 2023-07-25 16:00:00 发布

LittleCookie_

最新推荐文章于 2023-07-25 16:00:00 发布

阅读量102

点赞数

分类专栏： spark 文章标签： spark

本文链接：https://blog.csdn.net/czw0919/article/details/117666828

版权

spark 专栏收录该内容

17 篇文章 0 订阅

订阅专栏

package com.atguigu.bigdata.spark.core.rdd.builder

import org.apache.spark.rdd.RDD
import org.apache.spark.{SparkConf, SparkContext}

object Spark01_RDD_Memory {
  def main(args: Array[String]): Unit = {
    // TODO 准备环境
    // local[*] *表示当前系统最大可用核数 如果直接写local表示多线程模拟单核
    val sparkConf = new SparkConf().setMaster("local[*]").setAppName("RDD")
    val sc = new SparkContext(sparkConf)

    // TODO 创建RDD
    // 从内存中创建RDD，将内存中集合的数据作为处理的数据源
    val seq = Seq(1, 2, 3, 4)

    // parallelize表示并行(核数决定) ,parallelize 不好记所以spark提供了makeRDD
    // val rdd: RDD[Int] = sc.parallelize(seq)
    
    // makeRDD的底层调用的还是rdd对象的parallelize方法
    val rdd: RDD[Int] = sc.makeRDD(seq)

    rdd.collect().foreach(println)


    // 关闭环境
    sc.stop()
  }
}

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

LittleCookie_

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
spark-创建第一个RDD

package com.atguigu.bigdata.spark.core.rdd.builderimport org.apache.spark.rdd.RDDimport org.apache.spark.{SparkConf, SparkContext}object Spark01_RDD_Memory { def main(args: Array[String]): Unit = { // TODO 准备环境 // local[*] *表示当前系统最大可用核数如果直接
复制链接

扫一扫