Windows, Eclipse下开发Heritrix 3.1 (一)环境搭建

花费了大半天时间在Window系统中搭建Heritrix 3.1的Eclipse开发环境。走了些弯路,但最终都搞定。将其中的经验跟大家分一下。

[*]相关软件准备
(1)安装JDK1.6, 做java开发的都会,不罗嗦了。
(2)安装Maven2,版本2.2.1,具体步骤参考:[url]待写教程[/url]
(3)安装Git,具体步骤参考:[url]待写教程[/url]
(4)安装Eclipse,版本eclipse-jee-indigo-SR2-win32


[*][b]进入正题[/b]

(1)克隆Git源码库

cd C:\Users\jHan\Developer\Heritrix3\source //需修改为自己本地实际的路径
git clone git://github.com/internetarchive/heritrix3.git

或者使用TortoiseGit克隆源码仓库

(2)获取项目相关依赖包
进入Command,

cd C:\Users\jHan\Developer\Heritrix3\source\heritrix3 //heritrix3的源码目录
mvn -Dmaven.test.skip=true install


(3)修改.classpath文件--[b]需要注意的地方[/b]
源码中自带的.classpath有些问题,缺少一些依赖的jar包。具体如下:

增加依赖包libidn-1.15.jar和archive-commons-1.0-SNAPSHOT.jar:
<classpathentry kind="var" path="M2_REPO/org/gnu/inet/libidn/1.15/libidn-1.15.jar"/>
<classpathentry kind="var" path="M2_REPO/org/archive/archive-commons/1.0-SNAPSHOT/archive-commons-1.0-SNAPSHOT.jar"/>

删除依赖的工程archive-commons:
<classpathentry combineaccessrules="false" kind="src" path="/archive-commons"/>


(3)导入项目
打开Eclipse,

选择File / Import... / Existing Projects Into Workspace,选择C:\Users\jHan\Developer\Heritrix3\source\heritrix3


(4)Eclipse中设置M2_REPO变量

选择 Project > Properties > Java Build path >
选择 Libraries 标签 > Add variable > Configure variables > New
Name: M2_REPO
Path: C:/Users/jHan/.m2/repository //路径修改为自己本地maven仓库的实际位置


(5)创建Debug/Run Configuration

打开 Run / Debug Configurations...
双击 Java Applications 创建一个新的
选择 Main class: org.archive.crawler.Heritrix
在Arguments标签中操作:
在Program arguments中输入: -a admin:admin -l dist/src/main/conf/logging.properties
在VM arguments中输入: -Dheritrix.development
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值