scala-WordCount 简单项目练习

最新推荐文章于 2022-06-14 19:53:36 发布

reddy_Hu

最新推荐文章于 2022-06-14 19:53:36 发布

阅读量149

点赞数

分类专栏： scala 文章标签： scala

本文链接：https://blog.csdn.net/reddy_Hu/article/details/107617593

版权

scala 专栏收录该内容

9 篇文章 0 订阅

订阅专栏

package com.doit.scala.day02
import scala.collection.immutable

object WordCount {
  def main(args: Array[String]): Unit = {
    val lines: immutable.Seq[String] = List("spark hadoop flink spark", "hadoop flink spark hadoop", "spark hadoop flink spark")
    val list: immutable.Seq[(String, Int)]  = lines.flatMap(_.split(" ")).map((_, 1)).groupBy(_._1).map(t => (t._1, t._2.length)).toList.sortBy(-_._2)
   // println(list)
    //先对List扁平化 flat 切分 split
    val strings = lines.flatMap(_.split(" "))
    //将每一个单词放入元组(x,1) 中
    val wordAndOne: immutable.Seq[(String, Int)] = strings.map((_, 1))
    //将已经装进元组的List数据按照(x,1)的分组
    val grouped: Map[String, immutable.Seq[(String, Int)]] = wordAndOne.groupBy(_._1)
    //聚合
    val reduce: Map[String, Int] = grouped.map(t => (t._1, t._2.size))
    //转成List,排序
    val list1 = reduce.toList
    //降序排列
    val tuples: immutable.Seq[(String, Int)] = list1.sortBy(-_._2)
    //先正序排列再反转
    val tuples2: immutable.Seq[(String, Int)] = list1.sortBy(_._2).reverse
    println(tuples) //List((spark,5), (hadoop,4), (flink,3))

  }
}

reddy_Hu

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
scala-WordCount 简单项目练习

package com.doit.scala.day02import scala.collection.immutableobject WordCount { def main(args: Array[String]): Unit = { val lines: immutable.Seq[String] = List("spark hadoop flink spark", "hadoop flink spark hadoop", "spark hadoop flink spark") .
复制链接

扫一扫