- 博客(2)
- 资源 (7)
- 收藏
- 关注
转载 最新heritrix1.14.3的配置过程
关于Heritrix使用的步骤 1.关于安装: 目前的版本号为1.14.3,官网地址为 http://crawler.archive.org/。常规安装,即解压到相关目录,之后配置系统环境变量"HERITRIX_HOME"到该解压目录(Java环境已经配置好)。 2.安装的后续工作: 将 %HERITRIX_HOME%/heritrix-1.14.3.jar 解压到
2009-06-03 11:41:00 989
原创 eclipse中配置heritrix的图文过程----heritrix-1.14.3
关于搜索引擎书籍中国目前比较少,有过这方面了解的朋友一般都看过2007年人民邮电出版 lucene 2.0+heritrix 这本书吧。本人感觉还不错,理论知识较少点,具体步骤还比较详细。适合初学者。 简单介绍下heritrix: heritrix 是Java编写的开源爬虫。 扩展性比较好,但是配置适合的采集规则,比较复杂难理解。适合学习和研究。 此书中的h
2009-06-03 10:54:00 2784 3
关于搜索引擎的外文翻译
2010-05-21
JSP网上书店java附设计说明书
2010-03-31
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人