主要的类与接口
基本类或接口 | 说明 |
Directory | 表示索引的存储位置,并通常是文件的列表。这些文件被称为索引文件。索引文件通常创建一次,然后用于读操作或可以被删除。 |
Document | 表示一个虚拟文档与字段,其中字段是可包含在物理文档的内容,它的元数据等的对象。 |
Analyzer | 负责分析一个文件,并从将被索引的文本获取令牌/字。 |
IndexWriterConfig | 充当创造/在索引过程中更新指标的核心组成部分 |
IndexWriter | 索引写操作的类 |
DirectoryReader | 从索引文件读取的类 |
IndexSearcher | 从索引文件查找指定目标的类 |
QueryParser | 用于查询 |
Query | 用于查询,添加查询条件 |
TopDocs | 对于查询结果信息的记录 |
Term | 词元,可用于辅助查询 |
分词器及其相关类
分词器及其相关类 | 说明 |
---|---|
StandardAnalyzer | 标准分词器,每个汉字是一个词,每段英文是一个词,会忽略某些词 |
WhitespaceAnalyzer | 空格分词器,以空格分词 |
SimpleAnalyzer | 简单分词器,结果与空格分词器相似 |
CJKAnalyzer | 二分法分词器,对于英文,以空格分词,对于中文,会与前后的一个中文分别组词,会忽略指定默认单词 |
WhitespaceAnalyzer | 空格分词器,以空格分词 |
KeywordAnalyzer | 关键字分词器,整个一段作为分词结果 |
StopAnalyzer | 被忽略词分词器,忽略指定单词 |
查询相关类扩展
类或接口 | 说明 |
---|---|
MultiFieldQueryParser | 对多个域创建查询语句 |
TermQuery | 词条查询语句 |
PrefixQuery | 前缀查询语句 |
PhraseQuery | 短语查询语句 |
WildcardQuery | 通配符查询语句,Lucene中有 * ? 两个通配符, *表示任意多个字符,?表示一个任意字符 |
TermRangeQuery | 字符串范围查询 |
BooleanQuery | 布尔查询 |