take(),takeOrdered(),top() 返回一个列表,first()返回一个值
take
def take(num: Int): Array[T]
take用于获取RDD中从0到num-1下标的元素,不排序。
top
def top(num: Int)(implicit ord: Ordering[T]): Array[T]
top函数用于从RDD中,按照默认(降序)或者指定的排序规则,返回前num个元素。
takeOrdered
def takeOrdered(num: Int)(implicit ord: Ordering[T]): Array[T]
takeOrdered和top类似,只不过以和top相反的顺序返回元素。
代码示例
List<String> names = Arrays.asList("w13","w24","w55","w16","w7","w11","w22","w18","w99","w10","w11","w52");
//将list转为RDD并且分为2个partition
JavaRDD<String> nameRDD = javaSparkContext.parallelize(names,2);
List<String> take = nameRDD.take(3);
//take返回结果 w13, w24, w55
List<String> top = nameRDD.top(3);
//top返回结果 w99, w7, w55
List<String> takeOrderList = nameRDD.takeOrdered(3);
//takeOrdered 返回结果 w10, w11, w11
String first = nameRDD.first();
//first 返回结果 w13