lucene的笔记

1. lucene 的一些概念:
    1. 索引 Index
    2. 分词 Analyzer----> 词条 Term 
    3. 存储 Store 
    4. 文档 Document 
    5. 字段 Field
    
    
    上边概念串一串:
        一个 文档(Document)比如一个博客/文章(Blog/article) 中有多个字段:比如id, title,content
    每个字段中都由字符串组成,我们可以对字段(field)中的字符串进行分词(analyzer)处理创建词条(term),
    这些词条(term)只是一些孤立的字符(你,一,传,好,...),当需要用这些词条(term)检索相关的文档(document)时,
    要对这些词条(term)创建索引,让这些词条指向包含这些词条的文档;或者说是让这些词条指向包含这些词条的
    文档的存储位置;
    
    ps: 词条就是索引
    
    
2. 8月8日新的理解:
    1. 分词时会对每一个域(field) 分别建立分词
    2. 建立索引时会存储两个东西:
        1. 文档 对应关系就是 文档ID---->文档;
        2. 词条(term) 与 文档(document) 映射关系: 
            1. 域(id) 分词---(一对多)--->文档id
            2. 域(title) 分词---(一对多)--->文档id
            3. 域(content) 分词---(一对多)--->文档id
    2. 建立索引时会对文档(document)的各个域分别进行分词,
        到映射关系中
 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值