Hadoop应用测试

最新推荐文章于 2024-03-15 16:17:15 发布

a13393665983

最新推荐文章于 2024-03-15 16:17:15 发布

阅读量94

点赞数

文章标签：大数据运维

原文链接：http://www.cnblogs.com/lexus/archive/2012/03/11/2390002.html

版权

Hadoop应用测试

以下是我实际在虚拟机中测试完成的例子，

使用easy_hadoop的bash脚本需要改两个路径　，

还有pig的路径，使用８.1的stable版本

部署完成之后，要注意使用hadoop这个账号来运行

mkdir input && cd input

echo "aa" >1.txt

echo "bb" >> 1.txt

echo "aa" >> 1.txt

echo "zz" >2.txt

352 bin/hadoop dfs -copyFromLocal /opt/modules/hadoop/hadoop-0.20.203.0/input input
353 sudo -u hadoop bin/hadoop dfs -copyFromLocal /opt/modules/hadoop/hadoop-0.20.203.0/input input
354 sudo -u hadoop bin/hadoop jar hadoop-examples-0.20.203.0.jar wordcount input output

356 sudo -u hadoop bin/hadoop dfs -ls output/
357 sudo -u hadoop bin/hadoop dfs -cat output/part-r-00000

Hadoop应用测试

2009年07月16日星期四 13:18

Hadoop部署完成后，进行示例测试。hadoop-0.18.3目录下包含了hadoop-0.18.3-examples.jar，里面包含很多示例。下面测试一下最著名的wordcount。

开启HDFS，如下：

$ cd /home/howard/hadoop-0.18.3

$ bin/hadoop/start-dfs.sh

在本地目录建立input目录，并在其中新建file01.txt和file02.txt。编辑这两个txt，分别写入：Hello Hadoop Goodbye Hadoop、Hello World Bye World。然后把本地的这个目录拷贝到HDFS中，我在这个地方犯了错误，以为本地的已经就在HDFS中了，导致拷贝时找不到目录。

$ bin/hadoop dfs -copyFromLocal /home/howard/input input //前面的路径是本地input目录，后面的input表示存放在HDFS中

接下来，就可以执行wordcount了。要运行jar必须开启服务，

$bin/start-all.sh

$bin/hadoop jar hadoop-0.18.3-examples.jar wordcount input output //运行wordcount，结果存放在output目录中

下面就可以查看输出结果，

$ bin/hadoop dfs -cat output/part-00000 结果如下：

Bye 1

Goodbye 1

Hadoop 2

Hello 2

World 2

这是一个典型的MapReduce示例。

另外，如果在HDFS中有不需要的目录(里面包含文件)，可以使用下面的命令删除。

$ bin/hadoop dfs -rmr /user/howard/output

如果是空目录，则用$ bin/hadoop dfs -rm /user/howard/output

posted on 2012-03-11 12:57 lexus 阅读( ...) 评论( ...) 编辑收藏

转载于:https://www.cnblogs.com/lexus/archive/2012/03/11/2390002.html

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Hadoop应用测试

Hadoop应用测试以下是我实际在虚拟机中测试完成的例子，使用easy_hadoop的bash脚本需要改两个路径　，还有pig的路径，使用８.1的stable版本部署完成之后，要注意使用hadoop这个账号来运行mkdir input && cd ...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。