在使用hadoop的过程中,不可避免地遇到一些问题需要对hadoop代码进行改进,这就要求我们必须建立一个可修改hadoop代码的开发环境,下面的过程,我们就来建立一个基于Eclipse的hadoop开发环境。
- 安装Ant
Hadoop的编译需要Ant的支持,从这里下载并安装最新的Ant:http://ant.apache.org/bindownload.cgi。
安装完成后,别忘了将Ant的bin目录路径加入到windows系统的PATH环境变量中。
- 安装TortoiseSVN
Hadoop代码是以SVN的形式存放在apache服务器上,因此我们需要先安装一个SVN客户端,我选用的是熟悉的TortoiseSVN。
从这里下载并安装最新的TortoiseSVN:http://tortoisesvn.net/downloads.html
- Checkout hadoop代码
在我们前面建立的代码目录D:\hadoop\code\common\chunk目录下,checkout hadoop代码。我选用的是1.0.3版本的hadoop,所以远程服务器代码的URL填入的是:http://svn.apache.org/repos/asf/hadoop/common/tags/release-1.0.3/。
- 安装Eclipse
代码checkout完成后,就该安装Eclipse工具了。
从这里下载并安装EclipseClassic 4.2:http://www.eclipse.org/downloads/。
- 建立hadoop工程
在Eclipse中,点击File菜单的New->Java project,在打开的界面中输入以下信息:
然后点击Finish,即可导入我们已经checkout的hadoop基础组件代码。
导入完成后,你会看见左侧工程上会有很多小红叉,这是因为hadoop是需要用Ant进行编译,而不是java,所以我们要配置启用Ant编译:
* 左键点击common工程,选择Properties
* 选择左侧树形列表的Builders
* 点击右侧的New按钮,在弹出的对话框中选择AntBuilder,然后点击OK
* 在弹出的对话框中,将Name输入为:common_builder;并点击Browser File System按钮,选择D:\hadoop\code\common\chunk\build.xml文件