《Lucene In Action》笔记
captxb
这个作者很懒,什么都没留下…
展开
-
chapter04_Lucene的分析过程
分析 将域Field文本 转换为 项Term Term = fieldName + fieldValues[] 而 fieldValues 包含的是语汇单元token 分析 "The quick brown fox jumped over the lazy dog" 使用 StopAnalyzer 分析出的语汇单元 [quick] [brown] [fox] [jumped] ...原创 2019-12-04 15:33:30 · 160 阅读 · 0 评论 -
chapter03_为应用程序添加搜索功能
Lucene主要的API 类 目的 IndexSearcher 搜索索引的入口,调用重载的search方法 Query及其子类 封装某种查询类型的具体子类,作为search方法的参数 QueryParser 将用户输入的查询表达式处理成具体的Query的对象 TopDocs 保持由IndexSearcher.search()方法返回的具有较高评分的顶部文档 Sc...原创 2019-11-28 19:49:56 · 239 阅读 · 0 评论 -
chapter02_构建索引
Lucene如何对搜索内容进行建模 Document是索引和搜索的原子单位 Document是包含一个或多个Field的容器,而Field中包含真正的被搜索内容 Lucene可以针对域Field进行3种操作 (1) 域值可以被索引 被索引的域值必须是文本格式,二进制格式的域值只能被存储不能被索引 (2) 域被索引后,可以选择性的存储项向量,后者可以视为该域的一个小型反向索引集合,通...原创 2019-11-26 16:41:46 · 210 阅读 · 0 评论 -
chapter01_初识Lucene
Lucene 的核心 JAR 包很小只有1MB左右,并且不需要任何第三方依赖 随着信息量的增大,靠层次分类、多层目录的方法来搜索满足不了需求了,所以需要搜索引擎 例如 google、mac os的finder 信息检索(IR,Information Retrieval) 搜索程序的典型组件 Users ---> Search User Interface ---> *...原创 2019-11-26 10:37:06 · 183 阅读 · 0 评论