1. lucene 的一些概念:
1. 索引 Index
2. 分词 Analyzer----> 词条 Term
3. 存储 Store
4. 文档 Document
5. 字段 Field
上边概念串一串:
一个 文档(Document)比如一个博客/文章(Blog/article) 中有多个字段:比如id, title,content
每个字段中都由字符串组成,我们可以对字段(field)中的字符串进行分词(analyzer)处理创建词条(term),
这些词条(term)只是一些孤立的字符(你,一,传,好,...),当需要用这些词条(term)检索相关的文档(document)时,
要对这些词条(term)创建索引,让这些词条指向包含这些词条的文档;或者说是让这些词条指向包含这些词条的
文档的存储位置;
ps: 词条就是索引
2. 8月8日新的理解:
1. 分词时会对每一个域(field) 分别建立分词
2. 建立索引时会存储两个东西:
1. 文档 对应关系就是 文档ID---->文档;
2. 词条(term) 与 文档(document) 映射关系:
1. 域(id) 分词---(一对多)--->文档id
2. 域(title) 分词---(一对多)--->文档id
3. 域(content) 分词---(一对多)--->文档id
2. 建立索引时会对文档(document)的各个域分别进行分词,
到映射关系中
lucene的笔记
最新推荐文章于 2024-04-19 19:45:11 发布