使用hadoop的MapReduce来实现WordCount

最新推荐文章于 2021-09-04 10:58:32 发布

学习真是太快乐了呀

最新推荐文章于 2021-09-04 10:58:32 发布

阅读量493

点赞数 1

分类专栏：大数据学习文章标签： WordCount mapreduce

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44961794/article/details/91129341

版权

本文指导如何利用Hadoop的MapReduce框架执行WordCount任务。首先重启ssh服务，接着启动HDFS和YARN。创建并编辑article.data文件，输入示例文本，将其上传到HDFS的/wordcount/srcdata/目录。通过运行WordCount.jar，执行MapReduce计算，最后查看输出结果。

摘要由CSDN通过智能技术生成

首先依次在终端输入命令

sudo service ssh restart重启ssh服务。

start-dfs.sh启动HDFS，

start-yarn.sh启动yarn。

然后输入jps命令查看进程

输入vi article.data创建article.data并进入文件，按i键进行内容编辑模式，输入this is an example回车this is another example，然后按esc退出编辑模式，再输入：wq保存并退出文件

输入hadoop fs -mkdir /wordcount

输入hadoop fs -mkdir /wordcount/srcdata创建文件夹

输入hadoop fs -put article.data /wordcount/srcdata/上传文件

输入hadoop fs -ls /wordcount/srcdata/查看文件

输入cd ~/bigdata hadoop jar WordCount.jar com.bit.WordCount /wordcount/srcdata/ /wordcount/output进行计算

再输入hdfs dfs -cat /wordcount/output/part-r-00000查看计算结果

学习真是太快乐了呀

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
使用hadoop的MapReduce来实现WordCount

首先依次在终端输入命令sudo service ssh restart重启ssh服务。start-dfs.sh启动HDFS，start-yarn.sh启动yarn。然后输入jps命令查看进程输入vi article.data创建article.data并进入文件，按i键进行内容编辑模式，输入this is an example回车this is another exampl...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。