Spark实操------ wordcount实现

最新推荐文章于 2022-12-28 16:46:31 发布

moshanghuakai_pang

最新推荐文章于 2022-12-28 16:46:31 发布

阅读量248

点赞数 1

分类专栏： Hadoop Spark scala

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/moshanghuakai_pang/article/details/93755262

版权

Spark 同时被 3 个专栏收录

1 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

0 篇文章 0 订阅

订阅专栏

创建文件：

在Linux文件夹下，进如要文件的目录：输入vi test.txt

按i输入文本内容，输入完毕按esc，按:wq 保存退出

然后在命令行执行下面的命令：

hadoop fs –mkdir –p /Hadoop/Input （在HDFS创建目录）

hadoop fs –put test.txt /Hadoop/Input （将test.txt文件上传到HDFS）

hadoop fs –ls /Hadoop/Input （查看上传的文件）

hadoop fs –text /Hadoop/Input/test.txt （查看文件的内容）

启动spark

spark-shell

输入下面的语句：

val file=sc.textFile(“/Hadoop/Input/test.txt”)

val rdd = file.flatMap(line => line.split(“ ”)).map(word => (word,1)).reduceByKey(_+_)

val maps = rdd.collect()

for (i <- 0 to maps.length-1) {

println(maps(i))

}

moshanghuakai_pang

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Spark实操------ wordcount实现

创建文件：在Linux文件夹下，进如要文件的目录：输入vi test.txt按i输入文本内容，输入完毕按esc，按:wq 保存退出然后在命令行执行下面的命令：hadoop fs –mkdir –p /Hadoop/Input （在HDFS创建目录）hadoop fs –put test.txt /Hadoop/Input （将test.txt文件上传到HDFS）hadoop...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。