1.下载heritrix-1.14.1.zip和heritrix-1.14.1.src 并解压,解压heritrix-1.14.1.jar. 2.在eclipse下创建java project,命名为比如heritrix,进入其工程的目录,我的是F:\workspace\myeclipse\heritrix,删除src文件夹。 3.copy解压后的heritrix-1.14.1.zip文件夹下的lib,webapps,heritrix-1.14.1到F:\workspace\myeclipse\heritrix目录下,并删除F:\workspace\myeclipse\heritrix\heritrix-1.14.1目录下的org和st两个文件夹。 copy解压后的heritrix-1.14.1.src 文件夹下的heritrix-1.14.1\src\java下的org和st两个文件夹到F:\workspace\myeclipse\heritrix\heritrix-1.14.1\目录下 4.修改heritrix-1.14.1文件夹名称为src 5.修改src\heritrix.properties文件中的heritrix.cmdline.admin = 为 heritrix.cmdline.admin = admin:sun,这个就是要设置你的用户名和密码,可以随便,中间是冒号。 6.刷新工程,把lib下的jar包全部添加到工程中,即点击heritrix工程,右键属性---java build path---libraries--- add jars选择heritrix工程下lib所有jar。 7.运行org.archive.crawler.Heritrix类,在地址栏输入http://localhost:8080/ OK!就是这么简单! 下载地址:http://sourceforge.net/projects/archive-crawler/files/
转载于:https://blog.51cto.com/gjbxx110/447517