2021SC@SDUSC
综述
项目网站为 http://lucene.apache.org/ 我下载的版本为lucene8.9.0。 通过阅读readme.txt以及博客上的教程,分析项目,我们认为核心代码位于core文件夹内。故此我们决定对其展开长期研究分析。
项目展示及分配
我主要负责search和geo文件夹下代码的分析报告工作。当然,需要整体分析才能理解其中一部分功能。
对lucene的认识
Lucene是一套用于全文检索和搜索的开放源码程序库,由Apache软件基金会支持和提供。Lucene提供了一个简单却强大的应用程序接口,能够做全文索引和搜索。Lucene是现在最受欢迎的免费Java信息检索程序库。
Lucene最初是由Doug Cutting所撰写的,他是一位资深的全文索引及检索专家,曾经是V-Twin搜索引擎的主要开发者,后来在Excite担任高级系统架构设计师,目前从事于一些互联网底层架构的研究。他贡献出Lucene的目标是为各种中小型应用程序加入全文检索功能。
来自维基百科
lucene是根据关键字来搜索的文本搜索工具,只能在某个网站内部搜索文本内容,不能跨网站搜索。同时通过博客的学习,我了解了lucene相对于SQL的优点。
分析计划
首先从外部的使用中理解lucene的功能。随后阅读代码,深入分析功能的实现过程。