如何在Hadoop上跑通WordCount

最新推荐文章于 2023-02-12 09:49:00 发布

Bolong_

最新推荐文章于 2023-02-12 09:49:00 发布

阅读量711

点赞数

分类专栏： Hadoop WordCount Linux 文章标签： Linux Hadoop WordCount

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Bolong_/article/details/79712606

版权

先整体上说一下整个流程是怎么弄的。

首先我们需要有WordCount.java源程序，输入文档file1.txt，里面写上几行单词。接着对该源文件进行编译，编译之后打包成jar。然后把file1传到hadoop里，接着把file1、jar包扔给hadoop让他来帮我们统计每个单词出现的次数，结果输出在我们指定的路径里的part-r-00000。

下面来看具体是怎么操作的吧！

首先，需要Hadoop集群已经搭建好。我用的是1个slave（192.168.206.129），两个master（192.168.206.130/131）。

接着启动Hadoop：

cd /opt/linuxsir/hadoop/sbin

./start-dfs.sh

./start-yarn.sh

在三个节点上查看进程，验证Hadoop是否成功启动（我用的ssh无密码登陆），如果启动成功，就是下图所示。如果发现slave1和slave2上DataNode进程没有启动，可参考我之前写的一篇文章速查：搭建hadoop集群，遇到问题怎么解决（一）。，尝试解决这个问题：

jps

ssh root@192.168.206.130 jps

ssh root@192.168.206.131 jps

最低0.47元/天解锁文章

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
如何在Hadoop上跑通WordCount

先整体上说一下整个流程是怎么弄的。首先我们需要有WordCount.java源程序，输入文档file1.txt，里面写上几行单词。接着对该源文件进行编译，编译之后打包成jar。然后把file1传到hadoop里，接着把file1、jar包扔给hadoop让他来帮我们统计每个单词出现的次数，结果输出在我们指定的路径里的part-r-00000。下面来看具体是怎么操作的吧！首先，需要Hadoop集群已...
复制链接

扫一扫

专栏目录

Bolong_ CSDN认证博客专家 CSDN认证企业博客

码龄9年

9: 原创

37万+: 周排名

180万+: 总排名

2万+: 访问

: 等级

405: 积分

1: 粉丝

15: 获赞

5: 评论

31: 收藏

私信

关注

分类专栏

Linux 7篇
Hadoop 4篇
WordCount 2篇
Python 2篇

最新评论

通过用Python输出进度条效果，学习perf_counter()和sleep()函数的用法。
通往编程的路回复 syc写代码: MOOC上面说明了这个问题，IDLE编译器没有开放 \r 功能，因此代码里的\r语句没有执行效果，用其他解释器或者Windows命令行就可以看到效果了
通过用Python输出进度条效果，学习perf_counter()和sleep()函数的用法。
通往编程的路回复烧麦鱼: 是的，我看了MOOC上视频，应该是50//2，//表示取整数商
通过用Python输出进度条效果，学习perf_counter()和sleep()函数的用法。
syc写代码: 为什么我在IDLE中写完这段代码，执行没有这个效果，而是每次循环依次输出，不能覆盖前一次输出，问题出在哪里？谢谢
通过用Python输出进度条效果，学习perf_counter()和sleep()函数的用法。
烧麦鱼回复 weixin_42724821: 对啊我也觉得是50//2，那也不是22啊
通过用Python输出进度条效果，学习perf_counter()和sleep()函数的用法。
weixin_42724821: print("执行开始".center(scale//2,"-")) # .center()控制输出的样式，宽度为25//2，即22，汉字居中，两侧填充‘-’。这一句我不太理解，不应该是center(50//2, '-')嘛，为什么是25//2呢

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。