如何用Hadoop进行简单的词频统计？

美丽的樱桃裙

已于 2023-11-09 22:34:38 修改

阅读量422

点赞数 1

文章标签： hadoop 大数据

于 2023-11-09 21:07:40 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/G55331337547/article/details/134320174

版权

1、先用 hadoop fs -mkdir /input 创建一个input文件夹

2、用 vim word.txt 编辑该文件，写入一些字符串

3、用 hadoop fs -put word.txt /input/word.txt 将word.txt放到input文件夹中

4、用 cd /usr/Java/hadoop-3.1.3/share/hadoop/mapreduce/ 切换到mapreduce目录（/usr/Java/是我存放Hadoop文件的目录，可自行更换）

5、用 hadoop jar hadoop-mapreduce-examples-3.1.3.jar wordcount /input/word.txt /output

对word.txt进行词频统计，并且将统计后生成的文件放在output目录中。

点击图中的蓝色部分，然后点Download就可以下载词频统计后的文件：

美丽的樱桃裙

关注

1
点赞
踩
8

收藏

觉得还不错? 一键收藏
1
评论
如何用Hadoop进行简单的词频统计？

切换到mapreduce目录（/usr/Java/是我存放Hadoop文件的目录，可自行更换）对word.txt进行词频统计，并且将统计后生成的文件放在output目录中。将word.txt放到input文件夹中。编辑该文件，写入一些字符串。创建一个input文件夹。
复制链接

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。