import org.apache.spark.SparkConf;
import org.apache.spark.api.java.JavaRDD;
import org.apache.spark.api.java.JavaSparkContext;
import java.util.Arrays;
import java.util.List;
/**
* take(num)算子:
* 取出前num个元素,返回一个数组。
*
* takeOrdered(num,[ordering])算子:
* 取出前num个元素,并按照默认(升序)排序,或者按照自定义比较器进行排序。
*
* 本代码输出结果:
* [a, b, c, a, b]
* [a, a, b, b, c]
*
*/
public class TakeAndTakeOrderedDemo {
public static void main(String[] args) {
SparkConf conf = new SparkConf().setMaster("local").setAppName("spark");
JavaSparkContext sc = new JavaSparkContext(conf);
List<String> list = Arrays.asList("a","b","c","a","b","c","d");
JavaRDD<String> javaRDD = sc.parallelize(list);
//take算子:取出前5个元素
System.err.println(javaRDD.take(5));
//takeOrdered:取出前5个元素,按升序列
System.err.println(javaRDD.takeOrdered(5));
}
}
Java Spark算子:take 与 takeOrdered
最新推荐文章于 2024-07-17 23:05:08 发布