Spark实现wordCount（Scala版本）

最新推荐文章于 2024-03-28 21:40:19 发布

少心

最新推荐文章于 2024-03-28 21:40:19 发布

阅读量433

点赞数

本文链接：https://blog.csdn.net/qq_41595282/article/details/95385711

版权

大数据同时被 3 个专栏收录

12 篇文章 0 订阅

订阅专栏

Spark

9 篇文章 1 订阅

订阅专栏

Scala

6 篇文章 0 订阅

订阅专栏

废话不多说直接上代码

/**
      * 初始化
      */
    val conf = new SparkConf().setAppName("wordCount").setMaster("local[2]")
    val sc = new SparkContext(conf)
    val list = sc.makeRDD(List("Lisa Jennie Rosé Jisoo","Black Pink Jisoo Jennie Lisa Rosé"))

    /**
      * 这里和scala写差不多 都是先flatmap根据分隔符分开，再压平展开，然后生成元组，不过spark提供了reduceByKey，
      * 方便了很多
      */
    println(list.flatMap(_.split(" ")).map((_, 1)).reduceByKey(_ + _).collect.toBuffer)

执行结果如下图
在这里插入图片描述

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

少心

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Spark实现wordCount（Scala版本）

废话不多说直接上代码/** * 初始化 */ val conf = new SparkConf().setAppName("wordCount").setMaster("local[2]") val sc = new SparkContext(conf) val list = sc.makeRDD(List("Lisa Jennie Rosé Ji...
复制链接

扫一扫