wordCount的认识（scala版）

最新推荐文章于 2022-05-07 14:52:57 发布

kill -9

最新推荐文章于 2022-05-07 14:52:57 发布

阅读量419

点赞数

分类专栏： WordCount 文章标签： WordCount

本文链接：https://blog.csdn.net/wowSpark/article/details/50240571

版权

WordCount 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

val line = sc.textFile("/usr/local/word.txt");
line.flatMap(_.split(" "))
.map((_, 1)).reduceByKey(_ + _)
.collect().foreach(println)

1、通过textFile(“path/of/the/document”)
2、通过flatMap(_.split(” “))将数据按照 “ ”空格切分数据
3、通过map(( _ , 1)) 将每一条数据记录为1
4、通过reduceByKey( _ + _ ) 将数据按照key 进行数据的累加
5、collect() 执行统计操作
6、foreach(println)按照key分组dayin