package com.atguigu.bigdata.spark.core.operator.transform.test
import org.apache.spark.rdd.RDD
import org.apache.spark.{SparkConf, SparkContext}
object RDD_map_03 {
def main(args: Array[String]): Unit = {
val sparkConf = new SparkConf().setMaster("local[*]").setAppName("Operator")
val sc = new SparkContext(sparkConf)
// TODO 算子 -map
// 1.rdd的计算一个分区内的数据是一个一个执行逻辑
// 只有前面一个数据全部的逻辑执行完毕后,才会执行下一个数据
// 把rdd的第二个参数写1-分区内数据的执行是有序的
// 2.把rdd的第二个参数写2-不同分区数据计算是无序的
val rdd = sc.makeRDD(List(1, 2, 3, 4), 2)
val mapRDD01 = rdd.map(
num => {
println(">>>" + num)
num
}
)
val mapRDD02 = mapRDD01.map(
num => {
println("》》》" + num)
num
}
)
mapRDD02.collect()
sc.stop()
}
}
map
将处理的数据 逐条 进行映射转换,这里的转换可以是类型的转换,也可以是值的转换
效率慢