分布式编程初体验

   单机环境下伪分布式集群环境搭建请参考:http://blog.csdn.net/xiaoyi52/article/details/43528563。

   本文将介绍第一个hadoop程序具体怎么运行。

   运行环境为ubuntu14.04+eclipse+hadoop2.2.0。

   本文运行第一个程序出自参考资料1,部分细节根据实际情况修改,说明如下:

    1.hadoop插件根据对应的版本下载,如本文使用hadoop2.2.0,下载的也是2.2.0版本的插件。

    2.hadoop2.2.0自带的WorldCount在$HADOOP_HOME/share/hadoop/mapreduce/sourceshadoop-mapreduce-examples-2.2.0-sources.jar包中。

    3.两个版本的例子具体代码略有不同,将当前版本的代码拷贝到eclipse中之后,直接运行会报错,找不到输入文件。此时需要添加两行代码,也是参考文章中特意说明过的地方。不过此处修改如下(标红的部分):

 

    Configuration conf = new Configuration();
    conf.set("fs.default.name","hdfs://localhost:9000");
    String[] ars=new String[]{"input","output"};
    String[] otherArgs = new GenericOptionsParser(conf, ars).getRemainingArgs();
    if (otherArgs.length != 2) {
      System.err.println("Usage: wordcount <in> <out>");
      System.exit(2);
    }

   此处conf是读的是hadoop配置文件,其中fs的位置需要重新显示指明(参考资料2)。

   修改之后即可运行,输出结果可以通过浏览器查看,地址如下http://localhost:50070/dfshealth.jsp;也可通过eclipse中hdfs文件系统查看。

 

 参考资料

 [1]http://www.cnblogs.com/xia520pi/archive/2012/05/20/2510723.html

 [2]http://blog.csdn.net/duguduchong/article/details/8712733

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值