Hadoop的woldcount终于好使了

最新推荐文章于 2023-06-24 17:46:47 发布

圣骐

最新推荐文章于 2023-06-24 17:46:47 发布

阅读量500

点赞数

分类专栏： wordcount Hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012500825/article/details/35811797

版权

Hadoop 同时被 2 个专栏收录

6 篇文章 0 订阅

订阅专栏

2 篇文章 0 订阅

订阅专栏

前几天偶然在学校学长那里买了一本Hadoop的书，于是想学习一下Hadoop，安装了好久的Cygwin64，再配置hadoop，比较费劲（操作能力啊有待提高），但是一地个wordcount成功运行出来了，还是比价高兴的。

首先格式化namenode

$ bin/hadoop namenode -format

然后启动hadoop

$ bin/start-all.sh

在hdfs下建立输入文件夹

$ bin/hadoop fs -mkdir input

查看建立文件夹是否成功

$ bin/hadoop fs -ls

drwxr-xr-x - anshengqi supergroup 0 2014-06-29 19:27 /user/anshengqi/input

此处有点疑问，为何在/user/anshengqi下找不到input文件夹？

在本地文件夹（如当前目录下）新建两个文件a.txt，b.txt。

{echo "Hello World!">a.txt；echo “Hello Hadoop”>b.txt};

上传上面建立的两个文件到input问件夹下：

$ bin/hadoop fs -put a.txt input，但是此时有错：XXXX could only be replicated to 0 nodes, instead of 1

这个问题是由于没有添加节点的原因，也就是说需要先启动namenode，再启动datanode，然后启动jobtracker和tasktracker。这样就不会存在这个问题了。

$ bin/hadoop-daemon.sh start namenode

$ bin/hadoop-daemon.sh start datanode

$ bin/hadoop-daemon.sh start jobtracker

$ bin/hadoop-daemon.sh start tasktracker

然后可以上传文件。

$ bin/hadoop fs -put a.txt input

查看是否上传成功？

$ bin/hadoop fs -ls input

Found 2 items
-rw-r--r-- 1 anshengqi supergroup 12 2014-06-29 19:34 /user/anshengqi/input/a.txt
-rw-r--r-- 1 anshengqi supergroup 13 2014-06-29 19:35 /user/anshengqi/input/b.txt

上传成功！

运行worldcount程序例子：

14/06/29 19:39:27 INFO mapreduce.Job: Running job: job_201406291926_0001
14/06/29 19:39:28 INFO mapreduce.Job: map 0% reduce 0%
14/06/29 19:39:46 INFO mapreduce.Job: map 50% reduce 0%
14/06/29 19:39:49 INFO mapreduce.Job: map 100% reduce 0%
14/06/29 19:39:55 INFO mapreduce.Job: map 100% reduce 100%

....

查看结果：

$ bin/hadoop fs -cat output/*

Hadoop 1
Hello 2
World 1

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Hadoop的woldcount终于好使了

前几天偶然在学校学长那里买了一本Hadoop的书，于是想学习一下
复制链接

扫一扫

专栏目录

圣骐 CSDN认证博客专家 CSDN认证企业博客

码龄11年

45: 原创

14万+: 周排名

184万+: 总排名

11万+: 访问

: 等级

1447: 积分

12: 粉丝

24: 获赞

13: 评论

68: 收藏

私信

关注

热门文章

分类专栏

最新评论

systemctl start docker一直卡住排查
决胜万里: 防火墙开放就行了
systemctl start docker一直卡住排查
耳东先生a: 我知道咨询相关人员，呀，那就不用来问你了
C++中extern用于类
If_life: 如果 A 类有static数据呢
TI cc2540 USB dongle改造成HID 设备
圣骐回复 qq_29099215: 这个问题初步定位应该是出在TI的代码中，因为第一次并没有超时，各种看代码，部分并不能看明白，比如碰见USBCNT0,USBF1等等，其实这些都是usb寄存器，需要看相关说明文档，就可以了，看了这个文档，上面小节潜伏的两个问题也一起解决了。收到的数据长度在该文档的195页有说明。数据存放在USBFx（x是具体的endpoint）中。基本弄明白之后仿照halUartPollRx函数写一段接收的代码即可，不细说，有需求可自行查看该函数。
TI cc2540 USB dongle改造成HID 设备
qq_29099215: 你好，最近我也遇到了相同的问题，第一次发送成功，之后设备就断开了连接，请问当时是如何解决这个问题的呢？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。