lucene.net全文检索简介

/// <summary>
    /// 1 lucene.net全文检索简介
    /// 2 lucene.net七大对象介绍和多种query方式
    /// 3 lucene索引建立和查询DEMO
    /// 
    /// 
    /// lucene.net:全文检索的工具包,不是应用,只是个类库,完成了全文检索的功能
    ///      就是把数据拆分---存起来---查询时---拆分---匹配---结果
    /// 
    /// Analysis--分词器,负责把字符串拆分成原子,包含了标准分词,直接空格拆分
    ///           项目中用的是盘古中文分词,
    /// Document--数据结构,定义存储数据的格式
    /// Index--索引的读写类
    /// QueryParser--查询解析器,负责解析查询语句
    /// Search---负责各种查询类,命令解析后得到就是查询类
    /// Store---索引存储类,负责文件夹等等
    /// Util---常见工具类库
    /// 
    /// lucene是全文搜索必备的,是大型系统必备的
    /// 
    /// Search:
    /// TermQuery--单元查询  new Term("title","张三")                           title:张三
    /// BoolenQuery---new Term("title","张三")  and new Term("title","李四")   title:张三 + title:李四
    ///               new Term("title","张三")  or new Term("title","李四")    title:张三  title:李四
    /// WildcardQuery---通配符       new Term("title","张?")  title:张?
    ///                              new Term("title","张*")  title:张*
    /// PrefixQuery---前缀查询  以xx开头         title:张*                     
    /// PhraseQuery---间隔距离     包含没有   包含提莫  而且二者距离不能超过5   
    ///                             title: "没有 提莫"~5
    ///                      没有蘑菇的提莫       没有蘑菇的蘑菇的蘑菇的提莫         
    /// FuzzyQuery---近似查询,ibhone----iphone   title:ibhone~
    /// RangeQuery---范围查询 [1,100] {1,100}
    /// 
    /// Lucene.Net一进一出,建立索引需要获取数据源,分词-保存到硬盘
    ///                     索引查找,
    ///                     自然会有些延迟,以前淘宝上架宝贝,第二天才能搜索的
    ///                     索引更新策略:1 数据跟新---丢一个队列---一个processor通过队列完成更新
    ///                                   2 每一周全部索引一遍
    ///                                   
    /// lucene索引存的是原子--docid1,docid2,docid3
    /// 不store可以大量节约空间;查找时原子匹配多个id;
    /// 
    /// 
    /// 1 索引增删改查和分词处理
    /// 2 京东数据多线程建立索引
    /// 3 索引查询接口封装
    /// 
    /// Lucene--封装的lucene相关操作封装
    /// 
    /// LuceneAnalyze--负责完成查询关键字解析,尽可能拆分成原子数组
    ///                如果只有一个词,prefix查询  苹果*
    ///                如果是多个词,换成或者关系,
    ///                都是为了更多的命中结果(贪婪搜索)
    ///                做个关键词清理
    /// 
    /// LuceneBulid---  BuildIndex--MergeIndex 多线程写不同子路径,完成后合并
    ///                 增加/删除索引  更新索引-只能先删除再更新
    ///                 
    /// LuceneQuery---QueryIndexPage 支持关键字,支持范围过滤 支持排序
    ///               
    /// Processor---Lucene多线程建立索引
    ///             IndexBuilder 入口,启动多线程创建+完成后的Merge
    ///             IndexBuilderPerThread 每个线程是如何完成索引建立的
    /// 
    /// DataService--CommodityLucene对外提供的搜索封装
    ///              CommodityRepository-SqlHelper,完成数据库数据查询
    /// 
    /// Utility--通用帮助类
    /// CfgFiles--配置文件
    /// Model--实体类

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值