Hadoop应用测试

以下是我实际在虚拟机中测试完成的例子,
使用easy_hadoop的bash脚本需要改两个路径 ,
还有pig的路径,使用8.1的stable版本
部署完成之后,要注意使用hadoop这个账号来运行
mkdir input && cd input
echo "aa" >1.txt
echo "bb" >> 1.txt
echo "aa" >> 1.txt
echo "zz" >2.txt
  352  bin/hadoop dfs -copyFromLocal /opt/modules/hadoop/hadoop-0.20.203.0/input input
  353  sudo -u hadoop bin/hadoop dfs -copyFromLocal /opt/modules/hadoop/hadoop-0.20.203.0/input input
  354  sudo -u hadoop bin/hadoop jar hadoop-examples-0.20.203.0.jar wordcount input output

  356  sudo -u hadoop bin/hadoop dfs -ls output/
  357  sudo -u hadoop bin/hadoop dfs -cat output/part-r-00000
Hadoop应用测试
2009年07月16日 星期四 13:18

Hadoop部署完成后,进行示例测试。hadoop-0.18.3目录下包含了hadoop-0.18.3-examples.jar,里面包含很多示例。下面测试一下最著名的wordcount。

开启HDFS,如下:

$ cd /home/howard/hadoop-0.18.3

$ bin/hadoop/start-dfs.sh

在本地目录建立input目录,并在其中新建file01.txt和file02.txt。编辑这两个txt,分别写入:Hello Hadoop Goodbye Hadoop、Hello World Bye World。然后把本地的这个目录拷贝到HDFS中,我在这个地方犯了错误,以为本地的已经就在HDFS中了,导致拷贝时找不到目录。

$ bin/hadoop dfs -copyFromLocal /home/howard/input input     //前面的路径是本地input目录,后面的input表示 存放在HDFS中

接下来,就可以执行wordcount了。要运行jar必须开启服务,

$bin/start-all.sh

$bin/hadoop jar hadoop-0.18.3-examples.jar wordcount input output   //运行wordcount,结果存放在output目录中

下面就可以查看输出结果,

$ bin/hadoop dfs -cat output/part-00000 结果如下:

Bye         1

Goodbye 1

Hadoop   2

Hello        2

World     2

这是一个典型的MapReduce示例。

另外,如果在HDFS中有不需要的目录(里面包含文件),可以使用下面的命令删除。

$ bin/hadoop dfs -rmr /user/howard/output

如果是空目录,则用$ bin/hadoop dfs -rm /user/howard/output

posted on 2012-03-11 12:57  lexus 阅读( ...) 评论( ...) 编辑 收藏

转载于:https://www.cnblogs.com/lexus/archive/2012/03/11/2390002.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值