在Eclipse/MyEclipse下启动Heritrix需要运行org.archive.crawler.Hetrix这个类,这个类有两种运行的模式:开发模式和非开发模式,程序中是通过在VM arguments参数(-Dheritrix.development)来区别两种 配置。
开发模式的 配置如下
1.新建一个工程后,将源代码包中的src和lib文件夹复制到工程目录中,则此时工程目录下有bin、src、lib三个文件夹还有.classpath和.project两种工程 配置文件(工程建立时生成的)。
2.将 项目名称/src/conf 文件夹中modules、profiles、selftest三个文件夹以及heritrix.properties、jndi.properties剪切到上一层文件夹,即 项目名称/src 中,此时可以将原来的conf文件夹删除掉。
3.将 项目名称/src/java 文件夹中的com、org、st、meta-INF四个文件夹剪切到上一层文件夹中,即 项目名称/src 中,此时也可以将原来的java文件夹删除掉。
4.通过Build Path将 项目名称/lib 中的jar包引用到工程项目中。
5.找到heritrix.properties,然后在heritrix.cmdline.admin = admin:admin中随便设置个密码,设置方式是 用户名:密码;将heritrix.version改成1.14.3
6.在启动 配置中,在VM arguments添加-Dheritrix.development,在Program arguments添加--admin=admin:admin,然后选择Heritrix类启动程序。