在 eclipse 下的heritrix1.14.4的配置

             在其他帖子上看到有Eclipse 配置 Heritrix 1.14.4的文章,对其进行真理 

Eclipse 配置 Heritrix 1.14.4的配置过程如下: 

1. 首先从http://sourceforge.net/projects/archive-crawler/ 中下载 
 heritrix-1.14.4-src.zip(Windows) 

2. 在Eclipse 中创建一个java project的工程(可以命名为heritrix) 

3. 将heritrix-1.14.4-src.zip解压中的src/java 中的 com、org、st三个文件夹复制到工程src下。 

4. 将heritrix-1.14.4-src.zip解压中src中conf文件夹复制到项目根目录。 

5. 将heritrix-1.14.4-src.zip解压中lib文件夹复制到项目根目录。 

6. 将heritrix-1.14.4-src.zip解压中src/resources/org/archive/util中tlds-alpha-by-domain.txt文件复制到工程中org.archive.util包下。


7. 将heritrix-1.14.4.zip解压中webapps文件夹复制到项目根目录。 


8.在Eclipse中修改项目conf下heritrix.properties文件(
      修改内容至少两个两个地方: 
      heritrix.cmdline.admin = admin:admin(这里是用户名与密码,可任读者设定.)
      heritrix.cmdline.port = 8090 (注默认是8080的如果你已占用了这个端口号的话,要设另一个才行,因为我之前安装了tomcat,所以这里改为8090)

9.导入lib目录下的所有.jar文件选中,点击完成!

10.运行Heritrix    在org.archive.crawler下运行Heritrix.java

     


11.运行成功  在浏览器中打开 http://localhost:8090/



12.遇到问题:

        报错找不到类 sun.net.www.protocol.file.FileURLConnection,sun包是受保护的包,默认只有sun公司的软件才能使用。Eclipse会报错,把对保护使用warning就可以了。Windows -> Preferences -> Java -> Compiler -> Errors/Warnings-> Deprecated and trstricted API -> Forbidden reference (access rules): -> change to warning 

        

        报错 thread-10 org.archive.util.ArchiveUtils.<clinit>() TLD list unavailable  没有进行第 6 步





评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值