在Eclipse下运行Heritrix3.2.0(环境windows10 64位)

前几天直接用heritrix的程序运行,并成功抓取了网页。
现在用eclipse运行heritrix。步骤如下:

(前期准备:下载heritrix-3.2.0-src.zip(后面简称src.zip)和heritrix-3.2.0-dist.zip(后面简称dist.zip)这两个文件。步骤可以看我写的上一篇http://blog.csdn.net/tdtcn/article/details/51107231文章)

1.在eclipse中创建java项目。本例创建名称为MyHeritrix3a2a0

2.在项目下创建lib文件夹,并将dist.zip文件解压把dist\lib中的jar包复制到项目中的lib。并用项目引用那些jar包。
这里写图片描述

3.解压src.zip将以下目录中的文件复制到项目的src中
\engine\src\main\java中的org
\modules\src\main\java中的org
\commons\src\main\java中的org和st

4.在导入后我们发现项目中有两处错误。
这里写图片描述
解决方案是导入java的rt.jar包在jdk的\jre\lib目录下。(或者在环境变量中将rt.jar设置到classpath中,这个方法我没有试,但是应该是可行的)这样就解决的第一个错误。
这里写图片描述
第二个错误比较麻烦一点。因为他缺少一个KeyTool类,而这个类在rt.jar包中没有。但是我发现在Heritrix3.3.x版本得src中有这个类,所以我就下载了这个版本并提取了这个类出来。
下载地址

这里写图片描述

解压此文件,并将\commons\src\main\java\org\archive\util下的KeyTool.java文件放入sun\security\tools文件(自己创建)下然后将sun这个文件夹直接复制到项目中的src中(就是和第3步一样)这样就解决错误了。
这里写图片描述

5.现在开始运行前的配置。右键点击项目
这里写图片描述
如图点击进入项目配置页面
这里写图片描述
如图配置,除了名称可以任意,其他的就注意了。项目文本框要和我们创建的项目名一致,Main类文本框就要固定了,因为主函数就在org.archive.crawler.Heritrix。
这里写图片描述
这个也是固定的。如果以后改用户名和密码这里也要改。

6.最后点击运行。在控制台出现以下内容
这里写图片描述
说明配置成功。

最后就用浏览器登陆heritrix控制台就可以了。详情就看我上一篇内容吧。
http://blog.csdn.net/tdtcn/article/details/51107231

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
软件介绍: 使用前需要先安装java虚拟机,安装jre1.6后就可以使用了。否则会提示以下出错信息:A Java Runtime Environment(JRE) or Java Development Kit (JDK)must be available in order to run Eclipse. No Java virtual machinewas found after searching the following locations:C:\Downloads\Eclipse3.2文版\eclipse\jre\bin\javaw.exe'javaw.exe' in your current PATHEclipse是一种通用工具平台-普遍适用的开放式可扩展 IDE。它提供了功能丰富的开发环境,该环境允许开发者高效地创建一些能够无缝集成到 Eclipse平台的工具。工作台基本概念可让你了解 Eclipse 工作台的基本概念;Java开发:熟悉使用Eclipse开发Java程序。小组支持:了解如何与其他开发者合作。Eclipse 插件开发:了解如何通过构建新插件来扩展 Eclipse。通过完成一系列端到端教程,了解如何通过使用 Eclipse 来提高效率。JAVA开发:创建Hello World应用程序了解如何创建简单Java应用程序来显示“Hello world!”创建 Hello World SWT 应用程序了解如何创建独立SWT Java应用程序来对用户显示一个窗口。Eclipse 插件开发创建 Eclipse 插件这是一个端到端教程,用于说明如何创建插件、插件扩展、功能部件、更新站点及如何安装和卸载功能部件 创建富客户机平台(RCP)应用程序这是一个端到端教程,用于说明如何创建插件、定义基于插件的产品、定制产品、导出 RCP 应用程序和定义基于功能部件的产品 通过安装预先准备好的样本来研究 Eclipse(可能需要连接因特网)。多页面编辑器:显示如何创建具有多个页面的编辑器。属性表和大纲:演示如何使用属性表和“大纲”视图。自述文件工具:显示如何创建您自己的扩展点。JDT:下列样本演示了如何插入到 Java 开发工具。Java 编辑器演示为定制文本编辑器提供的标准功能。SWT:使用独立的 SWT 启动程序或者作为集成的工作台视图来运行 SWT 样本。工作台视图和独立应用程序:SWT 示例启动程序可启动许多 SWT 示例。其一些示例可独立于 eclipse 平台运行,其他的则作为工作台的视图提供。
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值