Lucene&Heritrix
文章平均质量分 78
gunner086
具有扎实深厚的计算机基础,同时深深热爱计算机行业。在以往的学习和工作中,练就了较强的程序调错能力,能够单独处理问题, 在处理问题的过程中讲究方法。本人勤奋刻苦,踏实稳重,喜欢突破常规,富于创新。善于交流与沟通,具有较强的团队合作精神和个人时间管理能力。
Attitude is everything!
展开
-
Heritrix-1.12.1在Eclipse中的配置
关于网络爬虫Heritrix,在配置上真是一件不容易的事情,之所以这样会说,是因为Heritrix开发之初就是基于在Unix平台的(可以参考官方Manual,网址为http://crawler.archive.org/articles/user_manual/index.html),可以保证非常容易地在Unix平台下轻松地启动。因此,在Windows平台下,配置起来让人感觉有点非常规。在网络上转载 2008-11-18 15:41:00 · 762 阅读 · 0 评论 -
使用Heritrix-1.12.1新建抓取任务
在文章 Heritrix-1.12.1在Eclipse中的配置 中,已经完成了对Heritrix-1.12.1在Eclipse中的配置。这时,可以登录WebUI,建立抓取任务了。首先启动Heritrix后台监听程序,然后登录WebUI(可以在文章 Heritrix-1.12.1在Eclipse中的配置 中参考启动过程、及其登录WebUI)。成功登录WebUI后,初始界面如图所示:转载 2008-11-18 15:45:00 · 1299 阅读 · 0 评论 -
Lucene关键字高亮显示
在Lucene的org.apache.lucene.search.highlight包中提供了关于高亮显示检索关键字的工具。使用百度、Google搜索的时候,检索结果显示的时候,在摘要中实现与关键字相同的词条进行高亮显示,百度和Google指定红色高亮显示。有了Lucene提供的高亮显示的工具,可以很方便地实现高亮显示的功能。高亮显示,就是根据用户输入的检索关键字转载 2008-11-25 17:00:00 · 5200 阅读 · 2 评论 -
lucene 支持的检索语法和检索运算符分类列表
【声明】1、本文转至http://www.diybl.com/course/3_program/java/javajs/200843/108185.html 2、《新一篇: lucene 支持的检索语法和检索运算符分类列表》请参考http://www.cnblogs.com/zsm/archive/2008/06/12/1218294.html转载 2008-11-25 17:12:00 · 1611 阅读 · 0 评论