lucene 建立索引与搜索所用到的相关类

      今天继续看《lucene in action》,将简单地做一下笔记。

  一、核心索引相关类

   1)IndexWriter

    职责:创建索引或添加lucene结构的记录(Document)到索引中——建立/修改索引而不允许读取索引。

 

   2)Directory

    职责:lucene所建立的索引位置。此类是个抽象类,其子类有两个FSDirectory和RAMDirectory,表明了lucene所建立的索引只有两个可能的位置:磁盘文件存储形式或内存存储形式。其两个子的继承关系下图(此图是对lucene 1.4.3源码进行逆向工程得到,截图去掉了FSDirectory类的两个关联关系,其它我没有检查其可靠性):

lucene Directory类关系图

 

        3)Analyzer

     职责:对被索引的文件进行分析(分词)便于建立精确的全文索引。这个类也是抽象类,其具体实现lucene接供文本分析器,具体如下图示:

Analyzerclass

   

     这些类具体作用有等进一步学习,重点是其扩展分词:Tokenizer类以适应新的字词,语义切分。

 

   4)Document

   职责:作为lucene的索引记录(类似于数据库的记录,记录由字段构成)。

   5)Field

   职责:作为lucene的Document的字段。其与Document类的关系图如下图示。

Documentclass

 

    数据库中表的字段有数据类型,lucene的字段也自己的数据类型,主要四种:Keyword,Unindexed,Unstored,Text其具体含义见 《luncene in Action》,但要注意在lucene 2.4.0中已引入几个新类,并且Field类的用法有些变化,在构造函数中指定字段类型,有了Termvertor类型。

 

    先就写到这儿吧,得吃饭去了。下午来再接着看,XP要持续开发部署,我来个持续学习lucene,呵呵,走了

   

   

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值