拆解Clucene系列(3)——Clucene的代码组织结构

CLucene的代码组织还是比较清晰的,本文以CLucene1.0为例,主要分为以下几个部分:

这里写图片描述

analysis

模块主要负责词法分析及语言处理,从而生成Term。也包括各种分析器

config

各种编译配置选项,以及一些与OS平台相关的内容。

debug

各种断言异常处理宏定义,错误常量。还自带一个内存泄漏跟踪工具和内存池

document

一个document对象就是用户提供的一篇文档,可以包括多个Field

index

模块主要负责索引的创建,如何读取索引,重要的类里IndexWriter,DocumentWriter,IndexReader,SegmentMerger,SegmentReader.
IndexWriter和DocumentWriter:负责创建索引
SegmentReader和IndexReader:负责读取索引
Segmentmerger:负责索引的合并

queryparser

Lucene自带的查询引擎。负责解析用户的输入,可以通过扫描用户输入的字符串,生成各种Query对象。Clucene中支持模糊查询,语义查询,短语查询,组合查询等等,如有TermQuery,BooleanQuery,RangeQuery,WildcardQuery等。

模块主要负责对索引的搜索,打分,和排序。

Store

主要负责对索引的存储。FSDirectory和RAMDistory是两个重要的类,一个实现了对磁盘的跨平台读写,另一个是把内存当成磁盘。

util

一些常用的工具类。主要有:
BitVector:位数组
PriorityQueue:优先级队列,好多地方都用到此结构。
VoidList和VoidMap:分别继承自STL的list 和map。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
以下是一个简单的 Pascal 实现的 CLucene 示例代码: 首先需要安装 CLucene 的 Pascal 绑定库 `clucene.pas`。可以从 https://github.com/graemeg/clucene-delphi 下载源代码,然后编译生成 `clucene.pas` 单元。 接下来,可以创建一个简单的控制台应用程序,使用以下代码实现搜索: ```pascal program CLuceneDemo; {$APPTYPE CONSOLE} uses SysUtils, clucene, cluceneindexwriter, clucenequery, clucenesearch, cluceneanalysis, cluceneanalysisstandard, cluceneutil, clucenestore, clucenedocument; var directory: TDirectory; analyzer: TAnalyzer; writer: TIndexWriter; doc: TDocument; parser: TQueryParser; query: TQuery; searcher: TIndexSearcher; hits: TTopDocs; i: Integer; docSearch: TDocument; field: TField; begin directory := TDirectory(FSDirectory.GetDirectory('index', True)); analyzer := TStandardAnalyzer.Create(LUCENE_30); writer := TIndexWriter.Create(directory, analyzer, True, TIndexWriter.MaxFieldLength.UNLIMITED); // 创建一个文档 doc := TDocument.Create; field := TField.Create('title', 'Lucene in Action', TField.Store.YES, TField.Index.ANALYZED); doc.Add(field); field := TField.Create('author', 'Erik Hatcher', TField.Store.YES, TField.Index.ANALYZED); doc.Add(field); field := TField.Create('publisher', 'Manning Publications', TField.Store.YES, TField.Index.ANALYZED); doc.Add(field); writer.AddDocument(doc); writer.Commit; // 创建一个查询解析器 parser := TQueryParser.Create(LUCENE_30, 'title', analyzer); query := parser.Parse('Lucene'); // 执行搜索 searcher := TIndexSearcher.Create(directory); hits := searcher.Search(query, 10); // 输出搜索结果 Writeln(Format('Total hits: %d', [hits.TotalHits])); for i := 0 to hits.ScoreDocs.Length - 1 do begin docSearch := searcher.Doc(hits.ScoreDocs[i].Doc); field := docSearch.GetField('title'); Writeln(field.StringValue); end; Readln; end. ``` 这个示例程序创建了一个名为 `index` 的索引目录,并向其添加了一个文档。然后,它使用 `TQueryParser` 创建了一个查询,查询包含 `title` 字段中的 `Lucene` 关键字。最后,它使用 `TIndexSearcher` 对象执行查询,输出匹配的文档标题。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值