Lucene 是一个高性能的信息检索链接库。能够添加索引和搜索的功能到你的应用程序中。
Lucene 核心类index
1 IndexWriter 创建一个索引, 并在索引中添加文档,但不是真的去读或者去搜索这个对象
2 Directory 是一个抽象类, 描述索引对象的位置。
FSDirectory 在文件系统中保存索引,也就是保存在硬盘中
RAMDirectory是将索引信息保存在内存中, 并在程序结束运行之后进行销毁,在内存中速度快, 适用于索引信息较少, 同时需要快速存储的索引
Analyzer 主要实现的是从文档中抽取令牌, 同时去掉其他内容。同时, 如果要索引内容存在着非纯文本, 那么将自动进行转换。它是一个抽象类,lucene实现了包括例如去掉(a,the)等停用词, 或者将索引全部转换小写使之大小写无关等具体类。因此在整合应用程序的时候选择具体的Analyzer 是非常关键的。
Document 是你需要索引文件的域的集合,可以看作是一系列的信息。
Field 实际上就是描述与文档相关的原数据信息。所有的信息分别保存在文档对应的不同域中。Field有以下几种不同类型
Keyword 用于索引和保存索引。主要用于在实体中需要保存的信息
Unindexed 无须索引,但是他的值保存在索引中,用于显示搜索结果的时候显示, 但是不会作为关键字进行搜索
UnStored分析,索引,但是不保存。大量文档不需要从原来的形式中进行检索
Text 分析 索引
Search
IndexSearcher 是搜索IndexWriter所建立的索引,也可以想象成将索引打开成一个只读模式
Term 是搜索的基本单元 包含name 和value
Query 是Lucene的基础。是很多查询的抽象类
TermQuery是最基本的类型, 用于匹配文档中的特定域中包含特定值的信息
Hits 是指向结果集合, 匹配当前查询
Lucene 核心类index
1 IndexWriter 创建一个索引, 并在索引中添加文档,但不是真的去读或者去搜索这个对象
2 Directory 是一个抽象类, 描述索引对象的位置。
FSDirectory 在文件系统中保存索引,也就是保存在硬盘中
RAMDirectory是将索引信息保存在内存中, 并在程序结束运行之后进行销毁,在内存中速度快, 适用于索引信息较少, 同时需要快速存储的索引
Analyzer 主要实现的是从文档中抽取令牌, 同时去掉其他内容。同时, 如果要索引内容存在着非纯文本, 那么将自动进行转换。它是一个抽象类,lucene实现了包括例如去掉(a,the)等停用词, 或者将索引全部转换小写使之大小写无关等具体类。因此在整合应用程序的时候选择具体的Analyzer 是非常关键的。
Document 是你需要索引文件的域的集合,可以看作是一系列的信息。
Field 实际上就是描述与文档相关的原数据信息。所有的信息分别保存在文档对应的不同域中。Field有以下几种不同类型
Keyword 用于索引和保存索引。主要用于在实体中需要保存的信息
Unindexed 无须索引,但是他的值保存在索引中,用于显示搜索结果的时候显示, 但是不会作为关键字进行搜索
UnStored分析,索引,但是不保存。大量文档不需要从原来的形式中进行检索
Text 分析 索引
Search
IndexSearcher 是搜索IndexWriter所建立的索引,也可以想象成将索引打开成一个只读模式
Term 是搜索的基本单元 包含name 和value
Query 是Lucene的基础。是很多查询的抽象类
TermQuery是最基本的类型, 用于匹配文档中的特定域中包含特定值的信息
Hits 是指向结果集合, 匹配当前查询