Lucene 全文磁力搜索
数据区(Field域document文档) + 索引区(分词后的词条)
数据存:
- 创建文档源对象,确定存储的磁盘路径
- 将文档源对象按照属性字段存入 数据区
- 文档中的值按照一定的分词策略存入 索引区
- 一次文档的存储,会在数据区给这个文档生成一个docId,该文档下有多个属性字段
数据查:
- 采用与存相同的分词器
- 按照条件检索 索引区 的词条
- 根据检索后的词条,查询 数据区 对应的文档,并为匹配上的文档打分(匹配度)
- 返回一个docId的数组
- 根据docId查询数据区的属性字段