spark-map算子(3)-并行计算效果演示

最新推荐文章于 2022-07-20 06:26:06 发布

LittleCookie_

最新推荐文章于 2022-07-20 06:26:06 发布

阅读量335

点赞数

分类专栏： spark 文章标签： spark

本文链接：https://blog.csdn.net/czw0919/article/details/117674881

版权

spark 专栏收录该内容

17 篇文章 0 订阅

订阅专栏

package com.atguigu.bigdata.spark.core.operator.transform.test

import org.apache.spark.rdd.RDD
import org.apache.spark.{SparkConf, SparkContext}

object RDD_map_03 {
  def main(args: Array[String]): Unit = {

    val sparkConf = new SparkConf().setMaster("local[*]").setAppName("Operator")
    val sc = new SparkContext(sparkConf)

    // TODO 算子 -map
    //  1.rdd的计算一个分区内的数据是一个一个执行逻辑
    //  只有前面一个数据全部的逻辑执行完毕后，才会执行下一个数据
    //  把rdd的第二个参数写1-分区内数据的执行是有序的
    //  2.把rdd的第二个参数写2-不同分区数据计算是无序的
    val rdd = sc.makeRDD(List(1, 2, 3, 4), 2)

    val mapRDD01 = rdd.map(
      num => {
        println(">>>" + num)
        num
      }
    )

    val mapRDD02 = mapRDD01.map(
      num => {
        println("》》》" + num)
        num
      }
    )

    mapRDD02.collect()

    sc.stop()

  }
}

map
将处理的数据逐条进行映射转换，这里的转换可以是类型的转换，也可以是值的转换
效率慢

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

LittleCookie_

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
spark-map算子(3)-并行计算效果演示

package com.atguigu.bigdata.spark.core.operator.transform.testimport org.apache.spark.rdd.RDDimport org.apache.spark.{SparkConf, SparkContext}object RDD_map_03 { def main(args: Array[String]): Unit = { val sparkConf = new SparkConf().setMaster(
复制链接

扫一扫