map()将函数作用于RDD中的每个元素,返回值构成新的RDD
flatmap()将函数应用于RDD中的每个元素,返回的迭代器的所有内容构成新的RDD,得到一个由各列表中的元素组成的RDD,而不是一个列表组成的RDD。
val rdd = sc.parallelize(List("Li Xiang","Xian Shi"))
输入:rdd.map(x=>x).collect
结果:res1: Array[String] = Array(Li Xiang,Xian Shi)
输入:rdd.flatMap(x=>x.split(" ")).collect
结果:res2: Array[String] = Array(Li,Xiang,Xian,Shi)