lucene.net全文检索简介

最新推荐文章于 2021-09-01 18:01:08 发布

大麦Max

最新推荐文章于 2021-09-01 18:01:08 发布

阅读量121

点赞数

分类专栏： C#

本文链接：https://blog.csdn.net/weixin_40715466/article/details/103982064

版权

C# 专栏收录该内容

15 篇文章 1 订阅

订阅专栏

/// <summary>
/// 1 lucene.net全文检索简介
/// 2 lucene.net七大对象介绍和多种query方式
/// 3 lucene索引建立和查询DEMO
///
///
/// lucene.net：全文检索的工具包，不是应用，只是个类库，完成了全文检索的功能
/// 就是把数据拆分---存起来---查询时---拆分---匹配---结果
///
/// Analysis--分词器，负责把字符串拆分成原子，包含了标准分词，直接空格拆分
/// 项目中用的是盘古中文分词，
/// Document--数据结构，定义存储数据的格式
/// Index--索引的读写类
/// QueryParser--查询解析器，负责解析查询语句
/// Search---负责各种查询类，命令解析后得到就是查询类
/// Store---索引存储类，负责文件夹等等
/// Util---常见工具类库
///
/// lucene是全文搜索必备的，是大型系统必备的
///
/// Search：
/// TermQuery--单元查询 new Term("title","张三") title:张三
/// BoolenQuery---new Term("title","张三") and new Term("title","李四") title:张三 + title:李四
/// new Term("title","张三") or new Term("title","李四") title:张三 title:李四
/// WildcardQuery---通配符 new Term("title","张?") title:张？
/// new Term("title","张*") title:张*
/// PrefixQuery---前缀查询以xx开头 title:张*
/// PhraseQuery---间隔距离包含没有包含提莫而且二者距离不能超过5
/// title: "没有提莫"~5
/// 没有蘑菇的提莫没有蘑菇的蘑菇的蘑菇的提莫
/// FuzzyQuery---近似查询，ibhone----iphone title:ibhone~
/// RangeQuery---范围查询 [1,100] {1,100}
///
/// Lucene.Net一进一出，建立索引需要获取数据源，分词-保存到硬盘
/// 索引查找，
/// 自然会有些延迟，以前淘宝上架宝贝，第二天才能搜索的
/// 索引更新策略：1 数据跟新---丢一个队列---一个processor通过队列完成更新
/// 2 每一周全部索引一遍
///
/// lucene索引存的是原子--docid1，docid2，docid3
/// 不store可以大量节约空间；查找时原子匹配多个id;
///
///
/// 1 索引增删改查和分词处理
/// 2 京东数据多线程建立索引
/// 3 索引查询接口封装
///
/// Lucene--封装的lucene相关操作封装
///
/// LuceneAnalyze--负责完成查询关键字解析，尽可能拆分成原子数组
/// 如果只有一个词，prefix查询苹果*
/// 如果是多个词，换成或者关系，
/// 都是为了更多的命中结果(贪婪搜索)
/// 做个关键词清理
///
/// LuceneBulid--- BuildIndex--MergeIndex 多线程写不同子路径，完成后合并
/// 增加/删除索引更新索引-只能先删除再更新
///
/// LuceneQuery---QueryIndexPage 支持关键字，支持范围过滤支持排序
///
/// Processor---Lucene多线程建立索引
/// IndexBuilder 入口，启动多线程创建+完成后的Merge
/// IndexBuilderPerThread 每个线程是如何完成索引建立的
///
/// DataService--CommodityLucene对外提供的搜索封装
/// CommodityRepository-SqlHelper，完成数据库数据查询
///
/// Utility--通用帮助类
/// CfgFiles--配置文件
/// Model--实体类

大麦Max

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
lucene.net全文检索简介

/// <summary> /// 1 lucene.net全文检索简介 /// 2 lucene.net七大对象介绍和多种query方式 /// 3 lucene索引建立和查询DEMO /// /// /// lucene.net：全文检索的工具包，不是应用，只是个类库，完成了全文检索的功能 /// 就是把数据拆分...
复制链接

扫一扫

专栏目录