Lucene学习笔记 (一)

在使用Lucene开发搜索引擎时,需要分成两大模块。索引和搜索,即Indexer和Searcher。顾名思义,Indexer负责对文档简历索引,Searcher负责在建立的索引上进行搜索。

 

最基本的Indexer在实现上需要以下几个类

IndexWriter 这个类主要负责建立修改索引。Lucene也提供其它的类完成这个功能

Directory 它是索引存储路径的抽象,它有2个子类,FSDirectory文件系统路径  RAMDirectory内存路径

Analyzer 文本分析器,分析需要锁定的文本。

Document 被索引文件的一个抽象,包括很多Field

Field Document的一个组成部分,具有4个类型:Keyword, UnIndexed, UnStored, Text

 

最基本的Searcher在实现上大致需要以下几个类

IndexSearcher 这个类负责在IndexWriter生成的索引上进行搜索

Term Term是搜索中的最小单位,它和Indexer中的Field相对应

Query 所有Query的抽象类,

TermQuery 最基本的Query类,使用Term作为搜索单位

Hits 包含一部分搜索结果的指针

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值