【SparkAPI JAVA版】JavaPairRDD——collectAsMap(八)

JavaPairRDD的collectAsMap方法讲解
官方文档说明
/**
   * Return the key-value pairs in this RDD to the master as a Map.
   *
   * @note this method should only be used if the resulting data is expected to be small, as
   * all the data is loaded into the driver's memory.
   */
中文含义

将此RDD中的键值对最终最为一个map返回给主方法
注意:只有当结果数据很小时才应使用此方法,所有的数据都被载入内存中。

方法原型
//scala
/**
 * Return the key-value pairs in this RDD to the master as a Map.
 */
def collectAsMap(): Map[K, V]
//java
public java.util.Map<K,V> collectAsMap()
实例
public class CollectAsMap {
    public static void main(String[] args) {
        System.setProperty("hadoop.home.dir", "E:\\hadoop-2.7.1");
        SparkConf sparkConf = new SparkConf().setMaster("local").setAppName("Spark_DEMO");

        JavaSparkContext sc = new JavaSparkContext(sparkConf);

        JavaPairRDD<String,String> javaPairRDD1 = sc.parallelizePairs(Lists.newArrayList(new Tuple2<String, String>("1","abc11"),
                new Tuple2<String, String>("2","abc22"),new Tuple2<String, String>("3","33333"),new Tuple2<String, String>("3","mmmmmm")));
        // 返回一个Map
        Map<String,String> map =  javaPairRDD1.collectAsMap();
        for(Map.Entry<String,String> entry : map.entrySet()){
            System.out.println(entry.getKey()+"->"+entry.getValue());
        }
    }
}
结果
19/03/19 16:16:26 INFO DAGScheduler: Job 0 finished: collectAsMap at CollectAsMap.java:22, took 0.742896 s
19/03/19 16:16:26 INFO SparkContext: Invoking stop() from shutdown hook
2->abc22
1->abc11
3->mmmmmm
19/03/19 16:16:26 INFO SparkUI: Stopped Spark web UI at http://10.124.209.6:4040
19/03/19 16:16:26 INFO MapOutputTrackerMasterEndpoint: MapOutputTrackerMasterEndpoint stopped!
19/03/19 16:16:26 INFO MemoryStore: MemoryStore cleared
19/03/19 16:16:26 INFO BlockManager: BlockManager stopped

可以看到返回的map中如果一个key存在多个value,后面的value会覆盖前面的value,最终只留下一个唯一的key-value

注意

数据量太大的情况下,不要用collect,会造成内存溢出

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值