在windows7下Eclipse中运行Hadoop的WordCount程序

运行环境:

Windows 7

JDK1.7

Hadoop2.5.2

一些准备:

hadoop-eclipse插件,用于在eclipse上访问Hadoop集群文件的插件

hadoop.dllwinutils.exe文件,在windows下运行Hadoop需要这两个文件

 

1. 首先,安装hadoop-eclipse插件,在网上下载与hadoop版本相对应的插件,然后将其放入eclipse中,可以将下载的jar包直接放入到eclipseplugins文件夹中或者自己新建文件夹通过创建xxx.link的文件来保存路径的方式。配置完插件之后重启eclipse软件会show View中看到MapReduce Tools表明安装插件成功。


2.双击打开MapReduce Tools,然后通过New Hadoop Location来创建连接Hadoop集群的信息。


3.上图的这两个端口并不是固定,而是根据自己的集群配置的,9000端口是配置的fs.defaultFS端口,9001是配置的mapreduce.jobtracker.address端口。如果能看到类似下图所示,列出了hdfs上的文件表明已经连接成功了。



4.在PreferencesHadoop Map/Reduce中配置下载后的Hadoop文件解压后的路径。

5.通过EclipseFile-->New打开新建窗口来新建一个Map/Reduce Project,如下图:


这样可以自动加载所需要的jar包,不需要再在项目中创建lib然后做Build Path的操作了。

6.将xx\hadoop2.5.2\hadoop-2.5.2\share\hadoop\mapreduce\sources路径下的hadoop-mapreduce-examples-2.5.2-sources.jar解压,可以找到WordCount文件,放入到刚才新建的MapReduce程序。


7.新建一个log4j.properties文件,里面需要进行配置,这是为了进行在控制台的输出,需要输出什么样的内容,可以根据自己的情况配置,注意这个新建文件并不是没有内容的。

8.将上述所说的hadoop.dllwinutils.exe文件放入到xx\hadoop2.5.2\hadoop-2.5.2\bin路径下,并且要将hadoop.dll文件放入到C:\Windows\System32路径下。不使用这两个文件是不能在windows下做本地运行wordcount程序的。

9.在刚才已经新建MapReduce项目中的WordCount程序的main函数中添加如下图所示的内容:


System.setProperty("hadoop.home.dir", "D:\\aaSoftware\\hadoop-2.5.2");其中:hadoop.home.dir是固定写法,因为程序中需要获取这个参数对应的值,也就是后面的hadop文件的路径。仅仅在程序中添加了这么一句代码,其他的都是hadoop源文件中自己的代码。

10.在WordCount程序中右键单击出现Run As-->Run Configuration


Arguments中配置输入输出的路径,中间用空格隔开,由于是在本地运行,其实这个路径无论输入输出路径写的是本地路径还是远程的集群路径都可以,其中的master指的是集群的主节点,它代替的是ip地址,由于本人在windowshosts文件中进行了配置,所以可以这么简写。

11.运行程序就会在控制台看到一些列的输出,并且能通过hadoo-eclipse插件看到运行的结果。否则,可能会由于某些地方配置不正确。


  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值