Lucene
文章平均质量分 61
liuweitoo
浪迹天涯多逍遥,随遇而安好自在~~~~
Young men without dreams as if the Spring without
展开
-
LuceneInAction(第2版)学习笔记——第一章 初识Lucene
Lucene: 是一个搜索类库,而不是完整的程序A. 索引组件 根据原始内容创建索引Raw Content : Acquire Content --> Build Document --> Analyze Document(*) --> Index Document(*) ==> Index(*)原始内容 : 获取内容(提取文本) --> 建立文档 -原创 2012-11-01 16:26:03 · 1646 阅读 · 0 评论 -
LuceneInAction(第2版)学习笔记——目录
LuceneInAction(第2版)学习笔记--目录 第一章 初识Lucene 第二章 构建索引 第三章 为应用程序添加搜索功能 第四章 Lucene的分析过程原创 2012-11-01 16:22:24 · 2248 阅读 · 0 评论 -
LuceneInAction(第2版)学习笔记——第二章 构建索引
1. 文档和域1.1.文档和域的关系文档是Lucene索引和搜索的原子单位。 文档为包含一个或多个域的容器,而域则依次包含“真正的”被搜索内容。 每个域都有一个标识名称,该名称为一个文本值或二进制值。 将一个文档加入到索引中时,可以通过一系列选项来控制Lucene的行为。 在对原始数据进行索引时,得先将数据转换成Lucene所能识别的文档和域。 在随后的搜索过原创 2012-11-01 16:26:33 · 2728 阅读 · 0 评论 -
LuceneInAction(第2版)学习笔记——第三章 为应用程序添加搜索功能
1. 实现简单的搜索功能1.1 对特定项的搜索: 编程实现查询语句 这种搜索程序员有最终解释权,可以提供灵活的UI IndexSearcher类是用于对索引中文档进行搜索的核心类,它有多个重要的重载方法。 public static Directory getBookIndexDirectory() throws IOException{ return FSDire原创 2012-11-01 16:27:08 · 1991 阅读 · 0 评论 -
Lucene索引文件结构速览
Lucene的索引结构是有层次结构。每个层次都保存了本层次的信息以及下一层次的元信息。1) 索引Index 在Lucene中,一个索引是放在一个文件夹中的2) 段Segment 一个索引可以包含多个段,段与段之间是独立的。 添加新文档可以生成新的段,不同的段可以合并。3) 文档Doucument 文档是我们建索引的基本单位 不同的是保存在不同的段中的 一原创 2012-11-05 15:35:57 · 1796 阅读 · 0 评论 -
LuceneInAction(第2版)学习笔记——第四章 Lucene的分析过程
分析Analysis,在Lucene中指的是将域(Field)文本转换成最基本的索引表示单元————项(term)的过程。 在搜索过程中,这些项用于决定什么样的文档能够匹配查询条件。 分析器对分析操作进行了封装,它通过执行若干操作,将文本转换成语汇单元。 这些操作有: 提取单词、去除标点符号、去掉字母上的音调符号、 将字母转换成小写(也称规范化)、去除常用词、 将单词原创 2012-11-01 16:27:54 · 3018 阅读 · 0 评论 -
LuceneInAction(第2版)学习笔记——第五章 高级搜索技术
LuceneInAction(第2版)学习笔记——第五章 高级搜索技术原创 2012-11-06 10:20:51 · 701 阅读 · 0 评论 -
个人博客总目录
OO学习目录DotNet学习目录Lucene和Solr 学习目录LuceneInAction(第2版)学习笔记——目录Orchard学习目录Linux学习目录原创 2012-11-08 10:54:09 · 1095 阅读 · 0 评论