lucene学习心得

最新推荐文章于 2024-11-12 10:47:45 发布

a3729291988

最新推荐文章于 2024-11-12 10:47:45 发布

阅读量449

点赞数

分类专栏： lucene 文章标签： lucene 文档 query solr search file

本文链接：https://blog.csdn.net/a3729291988/article/details/8100612

版权

lucene 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

lucene组成：索引组件+搜索组件

索引组件：获取内容（solr，nutch，grub，heritrix，drods，aperture，谷歌企业连接管理器)->建立文档（构建文档和域，文档过滤Tika) --->文档分析（内置分析器）--->文档索引

搜索组件（查全率+查准率): 用户搜索界面 ---->建立查询(QueryParser 查询解析器） ---> 搜索查询(纯布尔模型，向量空间模型，概率模型）-->展现结果

索引过程的核心类:

IndexWriter：负责创建新索引或者打开已有索引，以及向索引中添加，删除，或者更新被索引文档的信息

Directory：描述了lucene 索引的存储位置。是一个抽象类

Analyzer：分析器，提取词汇单元

Document：代表一些域（Field）的集合

Field：域

搜索过程的核心类

IndexSearcher：搜索索引，典型应用

Directory dir = FSDirectory.open(new File());
IndexSearcher search = new IndexSearcher(dir);
Query query = new TermQuery(new Term("contents","lucene"));
TopDocs hits = searcher.search(q,10);
searcher.close();

Term：搜索功能的基本单元。域名和单词。

Query：查询子类 TermQuery,BooleanQuery,PhraseQuery,PrefixQuery,PhrasePrefixQuery

TermQuery：

TopDocs：简单的指针容器，指向搜索出来的前几个。

a3729291988

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录