hadoop 0.20.2 wordcount 示例

在安装hadoop 之前一定要先安装免登陆的 ssh.可以参看安装ssh 的例子。http://blog.csdn.net/liuc0317/article/details/8621879
安装 hadoop 伪分布式 参看 http://blog.csdn.net/liuc0317/article/details/8613586
写这篇blog 是见解 http://www.cnblogs.com/xia520pi/archive/2012/05/16/2504205.html  的例子
接下来我们开始学习hadoop 为给我们提供的 wordcount 的例子。
第一步:查看一下 hadoop给我们提供了哪些命令,和哪些例子。
       进入hadoop 的目录下, cd hadoop 0.20.2
  然后运行 ./bin/hadoop  见图h-jar.jpg

  有一个 -jar 的命令


  再接着运行 ./bin/hadoop jar hadoop-0.20.2-examples.jar  见图h-wordcount


  这就是我们hadoop的 wordcount(类似于java 的helloword)
第二步:我们按示例的要求提供一个输入的input 和一个输出的output
        首先:在当前用户下创建一个file文件夹 mkdir file
        进行 file 文件夹 创建两个文件 file01.txt 和file02.txt
        cd file,touch file01.txt,touch file02.txt

        可以使用gedit 可是 vi 给他们添上内容。 见图hfile.jpg


第三步:在hadoop file system 上创建一个 上传文件夹 input
         ./bin/hadoop fs -mkdir input
第四步:把file文件夹下的两个文件上传到 新建的input文件夹下,并且显示input下的文件。
          ./bin/hadoop fs -put ~/file/file*.txt input
 ./bin/hadoop fs -ls input 

见hinput.jpg


第五步:运行hadoop 给我们提供的示例,见图h07.jpg
        ./bin/hadoop jar hadoop-0.20.2-examples.jar  wordcount input output

解释一下这个命令 ./bin/hadoop jar 运行一个jar 的命令 示例为 hadoop-0.20.2-examples.jar  名字叫 wordcount 输入文件夹是input 输出是 output文件夹


看一下运行的最后结果:


转载于:https://www.cnblogs.com/java20130726/archive/2013/03/21/3218279.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值