用scala实现wordcount

最新推荐文章于 2023-11-20 15:31:37 发布

wangzfox

最新推荐文章于 2023-11-20 15:31:37 发布

阅读量658

点赞数

分类专栏： SCALA 文章标签：算法

SCALA 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

这个算法来源于QQ群里一位叫醉清风的网友，对于怎么读取文件生成votes这个序列这里就不写了，主要是介绍count思路，使用groupBy函数聚集，然后使用两个map获得需要的统计量。

object wordCountByScala extends App {

  val votes = Seq(("scala", 1), ("java", 4), ("scala", 10), ("scala", 1), ("python", 10))
                                                  //> votes  : Seq[(String, Int)] = List((scala,1), (java,4), (scala,10), (scala,1
                                                  //| ), (python,10))
  //使用模式匹配聚集key相同的元素
  val votesByLang = votes groupBy {case (lang, _) => lang }
                                                  //> votesByLang  : scala.collection.immutable.Map[String,Seq[(String, Int)]] = M
                                                  //| ap(scala -> List((scala,1), (scala,10), (scala,1)), java -> List((java,4)), 
                                                  //| python -> List((python,10)))
   val sumByLang = votesByLang map { case (lang, counts) =>
     //对每一个Map元素分别提取后面的数值，并用sum计算总和
   val countsOnly = counts map { case (_, count) => count }
   (lang, countsOnly.sum)
 }                                                //> sumByLang  : scala.collection.immutable.Map[String,Int] = Map(scala -> 12, j
                                                  //| ava -> 4, python -> 10)
  
}

wangzfox

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
用scala实现wordcount

这个算法来源于QQ群里一位叫醉清风的网友，对于怎么读取文件生成votes这个序列这里就不写了，主要是介绍count思路，使用groupBy函数聚集，然后使用两个map获得需要的统计量。object wordCountByScala extends App { val votes = Seq(("scala", 1), ("java", 4), ("scala", 10), ("scala
复制链接

扫一扫