使用Scala实现worldcount功能

新建ScalaWorldCount对象:

package com.ruozedata.day4


object ScalaWorldCount {


  def main(args: Array[String]): Unit = {


    val lines = List("hello ruoze hello jepson","hello ruoze hello jepson hello china")


    /**第一种方法

      * flatMap=map+flatten  lines.flatMap 将数据压扁

      *  flatMap(_.split(" "))   拿到每一个元素(字符串),按照空格切割

      *  map((_,1))  将单词出现一次和1放在一起(放入元组)

      *  groupBy(_._1) 第一个_ 表示List中的每一个元组,取元组中的某一个元素用._n,即按照元组中的某一元素分组,返回是一个map

      *  map(t=>(t._1,t._2.size)) 第一个_ 拿到一个对偶元组,取元组中的第一个元组。_._2.size即是取对偶元组第二个的个数。

      *

      */

    val wc = lines.flatMap(_.split(" ")).map((_,1)).groupBy(_._1).map(t=>(t._1,t._2.size)).toList // .sortBy(_._2).reverse

    for(j <-  0 until wc.length) println(wc(j)+"\t")



    /** 第二种方法

      * foldLeft(0)(_+_._2)第一个_表示初始值或者上一次累加的结果 中第二个_ ,表示拿到的每一个元组,第三个元组的中第n个值

      */

    val wc = lines.flatMap(_.split(" ")).map((_,1)).groupBy(_._1).mapValues(_.foldLeft(0)(_+_._2))

    for(i <- wc) println(i+"\t")


  }


}


运行结果:

(china,1)

(ruoze,2)

(jepson,2)

(hello,5)


Process finished with exit code 0


来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/29609890/viewspace-2168575/,如需转载,请注明出处,否则将追究法律责任。

转载于:http://blog.itpub.net/29609890/viewspace-2168575/

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值