hadoop 需要注意的地方

最新推荐文章于 2024-08-19 15:15:31 发布

weixin_33721427

最新推荐文章于 2024-08-19 15:15:31 发布

阅读量72

点赞数

文章标签：大数据

原文链接：http://blog.51cto.com/6728496/1183884

版权

1、对于一个新手来说，简单地进行hadoop安装和wordcount demo程序的验证都是件十分不易的事情。安装完之后把环境变量写进/etc/profile,并source一下。

2、另外需要注意的是：

通过hadoop dfs -copyFromLocal /tmp/test.txt firstTest 是上传测试文件到 firstTest里。 firstTest 为一个文件

若想上传多个文件到一个目录下，则需要创建一个目录：hadoop dfs -mkdir thirdTest

然后可以上传多个文件到这个目录底下，然后将多个文件做为输入，来统计单词个数

假如有三个文件夹在/tmp/目录下，如下面所示为test1.txt、test2.txt、test.txt

root@cloud1:/tmp# ls
hadoop-root                        Jetty_0_0_0_0_50060_task____.2vcltf
hadoop-root-datanode.pid           Jetty_0_0_0_0_50070_hdfs____w2cu08
hadoop-root-jobtracker.pid         Jetty_0_0_0_0_50075_datanode____hwtdwq
hadoop-root-namenode.pid           Jetty_0_0_0_0_50090_secondary____y6aanv
hadoop-root-secondarynamenode.pid test1.txt
hadoop-root-tasktracker.pid                 test2.txt
hsperfdata_root                   test.txt
Jetty_0_0_0_0_50030_job____yn7qmk

上传三个测试文件到thirdTest目录下

hadoop dfs -copyFromLocal /tmp/test*.txt thirdTest

除此之外，需要注意，如果你上次使用过firstTest文件。这次又把测试文件的内容上传到这个文件夹时就会出现提示，文件夹已经存在，这时就需要重新使用别的文件名，比如secondTest等

3、执行wordcount

hadoop jar hadoop-examples-1.0.4.jar wordcount thirdTest result

注意：在执行的时候可能会提醒你result 这个文件已经存在，这说明上一次你在输出结果的时候已经使用到了result 这个文件，所以要么删掉result这个文件夹。，要么输出结果到其他文件夹里。比如说 resultn等。

转载于:https://blog.51cto.com/6728496/1183884

weixin_33721427

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
hadoop 需要注意的地方

1、对于一个新手来说，简单地进行hadoop安装和wordcount demo程序的验证都是件十分不易的事情。安装完之后把环境变量写进/etc/profile,并source一下。 2、另外需要注意的是：通过hadoop dfs -copyFromLocal /tmp/test.txt firstTest 是上传测试文件到 firstTes...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。