到此为止,以前所发表的关于Lucene的文章就把Lucene的基础篇包括玩完了。
从《搜索引擎》开始,我们对搜索引擎和Lucene有了初步的认识和一定了解,“这些内容,对于帮助我们从一个信息检索系统的门外汉变成一个局内人有着重大的意义”(摘自《开发自己的搜索引擎》——邱哲 符滔滔编著——人民邮电出版社)。
后来,在《建立简单的信息检索系统》中,通过对一个文档的处理,像我们演示了如何使用Lucene从文档检索关键字。(预处理、建立索引、构建查询对象、在索引中查找)。除此之外,还用了String的字符匹配和Lucene的查找做了比较,发现Lucene的查找效率的高超。
再来,我们在《索引》《索引建立全过程》《剖析索引的建立》等等文章中,让大家清清楚楚的看到建立索引的全过程,并且了解了IndexWriter、DocumentWriter、IndexReader这几个最为关键的组件。
这些知识的学习都为我们接下来更深刻的走入Lucene打下了基础。此外Lucene还具有许多细节,需要注意的是细节对于一个开发者来说,并非一定要关注,但开发者一定要了解Lucene的索引机理和各种性能参数的配置。
接下来,通过《Lucene查询》和《奇妙的QueryParser》的学习,我们学会了熟练掌握Lucene的各种Query对象。我们能够进行人性化的搜索。
最后由阐述了与Lucene的相关话题,PDFBox和xpdf等技术。想必和Lucene结合起来使用会更加强大。
Lucene还有很多东西要讲,并不能一口吃成胖子,不过我们坚持这样做下去,一定能和Lucene来一次亲密的接触的。
祝大家新年快乐,万事如意!!!过年啦…………………..!!!