Heritrix
chenjyuj
这个作者很懒,什么都没留下…
展开
-
Heritrix1.14.3 在Eclipse 配置总结
转自 http://hi.baidu.com/zpz2009/blog/item/080d3665c1cbd5f8f636540b.html 如果出现selection can not contains a main type 需要修改项目的构建路径。 默认的是Heritrix/src 把它删掉,改成是Heritrix就可以了 我在学习>一书时对Heritrix的配置感到很迷惑转载 2009-09-14 10:13:00 · 526 阅读 · 0 评论 -
heritrix 以CrawlController(后台)的方式运
转自 http://blog.csdn.net/songzhen640/archive/2008/07/16/2662443.aspx heritrix 以CrawlController(后台)形式运行的代码实现理解不一定对,不过我实现了在文件内可以改写order.xml 在写一个 seeds.txt 其中抓取的内容就在该文件夹内package main;import ja转载 2009-09-14 12:50:00 · 637 阅读 · 0 评论 -
数据库与索引结构
转自 http://blog.csdn.net/caoxu1987728/archive/2008/07/18/2673492.aspx 由文章标题可知 我们要建立数据库和索引。一,定义Product类 此类相当于MVC中的容器装载了数据库和索引所需要的对象,例如:category、name、type、content、summary、imageURI、originalRrl、转载 2009-09-16 00:07:00 · 861 阅读 · 0 评论