spark入门cogroup简单例子（JAVA）

最新推荐文章于 2022-04-27 21:35:24 发布

ZYJ_2012

最新推荐文章于 2022-04-27 21:35:24 发布

阅读量716

点赞数

分类专栏： spark

本文链接：https://blog.csdn.net/ZYJ_2012/article/details/59492026

版权

spark 专栏收录该内容

9 篇文章 0 订阅

订阅专栏

maven依赖：

<dependency>
    <groupId>org.apache.spark</groupId>
    <artifactId>spark-core_2.10</artifactId>
    <version>1.6.0</version>
</dependency>

public class CoGroup {
    public static void main(String[] args) {
        /**
         * 创建spark配置对象SparkConf，设置spark运行时配置信息，
         * 例如通过setMaster来设置程序要连接的集群的Master的URL，如果设置为local，
         * spark为本地运行
         */
        SparkConf conf = new SparkConf().setAppName("My first spark").setMaster("local");
        /**
         * 创建JavaSparkContext对象
         * SparkContext是spark所有功能的唯一入口，
         * SparkContext核心作用，初始化spark运行所需要的核心组件，同时还会负责spark程序在master的注册。
         *
         */
        JavaSparkContext sc = new JavaSparkContext(conf);
        /**
         * 初始化学生集合
         */
        List<Tuple2<Integer,String>> nameList = Arrays.asList(new Tuple2<Integer,String>(1,"xiaoming"),
                new Tuple2<Integer,String>(2,"feifei"),
                new Tuple2<Integer,String>(3,"katong"));
        /**
         * 初始化分数集合
         */
        List<Tuple2<Integer,Integer>> scoreList = Arrays.asList(
                new Tuple2<Integer,Integer>(1,90),
                new Tuple2<Integer,Integer>(2,80),
                new Tuple2<Integer,Integer>(1,70),
                new Tuple2<Integer,Integer>(3,60),
                new Tuple2<Integer,Integer>(2,80),
                new Tuple2<Integer,Integer>(1,70));
        //转成rdd
        JavaPairRDD<Integer, String> names = sc.parallelizePairs(nameList);
        JavaPairRDD<Integer, Integer> scores = sc.parallelizePairs(scoreList);
        //聚合分组
        JavaPairRDD<Integer, Tuple2<Iterable<String>, Iterable<Integer>>> cogroup = names.cogroup(scores);
        //打印
        cogroup.foreach(new VoidFunction<Tuple2<Integer, Tuple2<Iterable<String>, Iterable<Integer>>>>() {
            public void call(Tuple2<Integer, Tuple2<Iterable<String>, Iterable<Integer>>> integerTuple2Tuple2) throws Exception {
                System.out.println(integerTuple2Tuple2._1+"  "+integerTuple2Tuple2._2._1+"  "+integerTuple2Tuple2._2._2);
            }
        });
        //关闭
        sc.close();
    }

}

ZYJ_2012

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
spark入门cogroup简单例子（JAVA）

maven依赖： org.apache.spark spark-core_2.10 1.6.0public class CoGroup { public static void main(String[] args) { /** * 创建spark配置对象SparkConf，设置spark运行时配置信息，
复制链接

扫一扫