DotLucene的发展历史
Lucene-〉NLucene-〉Lucene.Net-〉DotLucene
Lucene 是一个基于 Java 的全文索引工具包,Lucene的贡献者 Doug Cutting 是一位资深全文索引/检索专家,曾经是 V-Twin 搜索引擎(Apple 的 Copland 操作系统的成就之一)的主要开发者,后在 Excite 担任高级系统架构设计师,目前从事于一些 Internet 底层架构的研究。他贡献出的 Lucene 的目标是为各种中小型应用程序加入全文检索功能。
Lucene 早先发布在作者自己的 www.lucene.com,后来发布在 SourceForge,2001年年底成为 APACHE 基金会 Jakarta 的一个子项目。
已经有很多Java项目都使用了Lucene作为其后台的全文索引引擎,比较著名的有:
Jive:WEB论坛系统;
Eyebrows:邮件列表 HTML 归档/浏览/查询系统,本文的主要参考文档“TheLucene search engine: Powerful, flexible, and free”作者就是 EyeBrows 系统的主要开发者之一,而 EyeBrows 已经成为目前 APACHE 项目的主要邮件列表归档系统;
Cocoon:基于 XML 的 Web 发布框架,全文检索部分使用了Lucene;
Eclipse:基于 Java 的开放开发平台,帮助部分的全文索引使用了 Lucene。
Lucene 本身不支持中文的索引,但它良好的架构设计,使得只需根据语言词法分析接口,增加一个中文解析器即可实现中文的索引。这一工作是由车东(http://www.chedong.com/)完成的:WebLucene 中提供了 CJKTokenizer,可以分析东亚文字