在使用hadoop的过程中,不可避免地遇到一些问题需要对hadoop代码进行改进,这就要求我们必须建立一个可修改hadoop代码的开发环境,下面的过程,我们就来建立一个基于Eclipse的hadoop开发环境。
- 安装Ant
Hadoop的编译需要Ant的支持,从这里下载并安装最新的Ant:http://ant.apache.org/bindownload.cgi。
安装完成后,别忘了将Ant的bin目录路径加入到windows系统的PATH环境变量中。
- 安装TortoiseSVN
Hadoop代码是以SVN的形式存放在apache服务器上,因此我们需要先安装一个SVN客户端,我选用的是熟悉的TortoiseSVN。
从这里下载并安装最新的TortoiseSVN:http://tortoisesvn.net/downloads.html
- Checkout hadoop代码
在我们前面建立的代码目录D:\hadoop\code\common\chunk目录下,checkout hadoop代码。我选用的是1.0.3版本的hadoop,所以远程服务器代码的URL填入的是: