-
集合标量行动操作
-
存储行动操作
集合标量行动操作
-
first(): T 返回RDD中的第一个元素,不进行排序
-
count(): Long 返回RDD中的元素个数
-
reduce(f:(T, T) => T): T 根据映射函数f,对元素进行二元计算
-
collect(): Array[T] 将RDD转换为数组
-
take(num: Int): Array[T] 获取RDD中下标从0—num-1的元素,不进行排序
- top(num: Int): Array[T] 从RDD中,按照默认(降序)或者指定排序规则,返回前num个元素
- takeOrdered(num: Int): Array[T] 和top功能类似,区别在于按照top相反的顺序返回元素
scala> var rdd = sc.makeRDD(Array(("A", 1), ("A", 2), ("A", 3), ("B", 4), ("B", 5), ("C", 6), ("C", 7), ("C", 8), ("C", 9), ("D", 10)))
rdd: org.apache.spark.rdd.RDD[(String, Int)] = ParallelCollectionRDD[60] at makeRDD at <console>:24
scala> rdd.collect
res50: Array[(String, Int)] = Array((A