Lucene,搜索领域的新贵族
2006年5月第一周推荐
点击此处可以在第二书店网站免费下载此书第8章《Lucene基础》
(感谢第二书店提供)
在信息泛滥的互联网业界内,搜索这个领域已经开始被越来越多的人所关注。然而相对较高的技术门槛却令许多公司或个人望而却步。有人曾经统计过,如果完全自主研发的话,一个公司可能要经过几年时间的开发和完善才能建立起一套自己的搜索引擎软件;如果购买GOOGLE的搜索服务的话,价格昂贵不说,而且很有可能会泄漏公司的机密。在这种情况下,一个名词走进了我们的视野:Lucene.
Lucene是Apache软件基金会Jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包,它不是完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎及部分文本分析引擎。Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎。
人民邮电出版社最新出版的这本《征服Ajax+Lucene——构建搜索引擎》,同时涵盖Ajax和Lucene的基础内容,共分为两部份:第1部分为Ajax的相关知识,包括了Ajax入门体验、JavaScript关键技术、CSS表示技术、DOM技术、XmlHttpRequest对象和Ajax的工作流程、经典实例以及页面编程中的性能和安全性问题等内容,第2部分阐述了Lucene的相关知识,包括Lucene基本概念、入门实例、建立索引、通过索引来搜索文件、使用分析器、高级搜索技巧、性能测试、中文问题,以及Lucene中的一些实用工具。
纵观全书,前面的Ajax部分论述过于浅显,基本上是概念的罗列,示例虽多却少有精辟的论述和讲解,似乎有拼凑之嫌,唯一的闪光点在于对Google Suggest深入浅出的分析,看得出作者还是费了一番苦心的;然而真正值得一看的是后面的Lucene部分,可以称得上是国内第一本关于Lucene比较全面的中文书籍资料。作者把Lucene的各种基本概念用浅显易懂的方式进行了讲述,同时制作了大量的例子来引导读者构建搜索引擎。在其有限的篇幅中作者还加入了一章对Lucene所构建的搜索引擎的性能测试,以此使读者对于Lucene的能力有了更直观的认识。对Lucene有兴趣的读者可以把它当作入门资料来读,另外,后面部分的实例也比较充分,由浅入深的向读者介绍Lucene的相关知识。
小贴士:Lucene开发包下载:
下载地址1:http://mirror.vmmatrix.net/apache/lucene/java/
下载地址2:http://apache.justdn.org/lucene/java/
有关于Lucene的相关内容,请访问
实战 lucene,第 1 部分: 初识 lucene
lucene学习笔记——初试lucene
利用lucene搜索java源代码
lucene 全文检索实践
lucene入门之--运行lucene-demo 更多...
注:本文部分段落引用《征服Ajax+Lucene——构建搜索引擎》,作者:李刚 宋伟 邱哲