spark-map算子(1)

最新推荐文章于 2022-12-02 02:07:06 发布

LittleCookie_

最新推荐文章于 2022-12-02 02:07:06 发布

阅读量286

点赞数

分类专栏： spark 文章标签： spark

本文链接：https://blog.csdn.net/czw0919/article/details/117668745

版权

spark 专栏收录该内容

17 篇文章 0 订阅

订阅专栏

package com.atguigu.bigdata.spark.core.operator.transform.test

import org.apache.spark.rdd.RDD
import org.apache.spark.{SparkConf, SparkContext}

object RDD_map_01 {
  def main(args: Array[String]): Unit = {

    val sparkConf = new SparkConf().setMaster("local[*]").setAppName("Operator")
    val sc = new SparkContext(sparkConf)

    // TODO 算子 -map
    //  创建数据源
    val rdd = sc.makeRDD(List(1, 2, 3, 4))
    // 需求:把数据源中的元素*2
    // 原:1,2,3,4
    // 变:2,4,6,8

    //  1.方案一
    // map需要传递一个函数所以我们定义一个函数mapFunction
    //  def mapFunction(num:Int):Int={
    //    num*2
    //  }

    //  val mapRDD: RDD[Int] = rdd.map(mapFunction)
    //  mapRDD.collect().foreach(println)

    //  2.方案二-简化-使用匿名函数
    //  val mapRDD: RDD[Int] =rdd.map((num:Int)=>{num*2})
    //  mapRDD.collect().foreach(println)

    //  3.方案三-简化
    //  当函数逻辑的代码只有一行的时候{}可以省略
    //  如果参数的类型可以自动推断出来，类型可以省略
    //  如果参数只有一个那么()可以省略
    //  如果参数在逻辑当中只出现一次，而且是按顺序出现的那么参数可以使用_代替
    //  结果为
    val mapRDD: RDD[Int] = rdd.map(_ * 2)
    mapRDD.collect().foreach(println)

    sc.stop()

  }
}

LittleCookie_

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
spark-map算子(1)

package com.atguigu.bigdata.spark.core.operator.transform.testimport org.apache.spark.rdd.RDDimport org.apache.spark.{SparkConf, SparkContext}object RDD_map_01 { def main(args: Array[String]): Unit = { val sparkConf = new SparkConf().setMaster(
复制链接

扫一扫