Spark的简单使用之WordCount统计

一、准备要进行统计的文件
这里写图片描述
可以看到我这里测试的文件名称叫wc.txt
里面的内容也比较少,就六个单词用逗号分隔。

二、计算代码

scala> val file = spark.sparkContext.textFile("file:///root/Desktop/wc.txt") #文件路径

scala> val WordCounts = file.flatMap(line => line.split(",")).map((word => (word, 1))).reduceByKey(_ + _)

scala> WordCounts.collect

//将计算结果保存到HDFS
scala> WordCounts.saveAsTextFile("/user/result")
//将计算结果保存到本地
scala> WordCounts.saveAsTextFile("file:///root/Desktop/result")
//ps:再次保存不能覆盖,会报错。

可以看到这里计算代码非常的简单,就三行。

三、运行结果
这里写图片描述

可以看出计算结果为:
(hello,3)
(welcome,1)
(world,2)

scala的退出为
scala> :quit

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值