当前对Nutch在eclipse下的配置文章其实已经有很多了,但是大都和官网一样,配置信息不全,版本不一致。。。因此本文针对当前Nutch最新的版本Nutch 2做一个详细的配置说明。如有遗漏欢迎吐槽。
首先,还是先重温下Nutch是干什么的吧。详见Nutch wiki。本文不加赘述。
- 准备工作:
1. Eclipse安装
本文采用的是Eclipse Juno (4.2) SR1 Packages,下载地址: http://www.eclipse.org/downloads/。
1.1 为Eclipse安装Subclipse插件,用来check out Nutch源码。下载地址: http://subclipse.tigris.org/
1.2 为Eclipse安装IvyDE插件,用来管理项目依赖jar包。 下载地址: http://www.apache.org/dist/ant/ivyde/updatesite.
2. Nutch2.1
2.1 下载地址: http://www.apache.org/dyn/closer.cgi/nutch/。
2.2 解压即可。
3. Cygwin
3.1 下载地址: http://cygwin.com/setup.exe
3.2 设置Cygwin的环境变量,右击"我的电脑" - 属性 - 高级 - 环境变量 - 在系统变量中选择PATH变量,编辑PATH变量,在PATH后面添加C:\cygwin\bin (对应自己Cygwin安装目录的bin文件路径)
- 配置步骤:
1.插件install
Eclipse Juno中安装Subclipse或IvyDE插件的步骤可以参考我的另一篇博客http://blog.csdn.net/ameliawmp/article/details/7859855
2. 使用Subclipse SVN插件Check out Nutch代码。
在Eclipse中打开SVN视图, 菜单项选择Windows - Open Perspective - Other ...点击"SVN资料库研究",在弹出的视图中右击 - 新建 - 资源库位置,在弹出的对话框中加入Nutch的URL:http://svn.apache.org/repos/asf/nutch/trunk/ , 点击"Finish"。
右击URL& check out。
按照图示红框标记步骤Check Out Nutch项目。