Lucene是一款开源的搜索软件,它包括以下子项目:
- lucene java,王牌子项目,提供基于java的索引和搜索技术,还有拼写检查,匹配高亮和高级的分词能力。
- Driods,是一款智能的自动爬取框架,目前还是孵化状态。
- Lucene.Net,lucene的C#版本,也在孵化中。
- Lucy,Lucene的C版本,大部分是用C实现的。
- Mahout,lucene的子项目,目的是建立一套不断学习进化的机制。
- Nutch,基于Lucene用BS结构实现的搜索引擎。
- Open Relevance Project,一个新的子项目,主要是做关联测试和信息检索,并加入了机器学习机制。
- PyLucene,Lucene的Python版本。
- Solr,基于Lucene建立的搜素服务,提供了各种接口。
- Tika,文本分析工具库,包括元数据的检测和提取,以及构造文档目录等。