【Lucene02】索引的相关概念

原创 2016年08月29日 21:23:57

一、重要类

(1)IndexWriter:索引过程中的核心组件,用于创建新索引或者打开已有索引,以及向索引中添加、删除、更新被索引文档的信息。
(2)Document:代表一些域(field)的集合。
(3)Field及其子类:一个域,如文档创建时间,作者,内容等。
(4)Analyzer:分析器。
(5)Directory:可用于描述Lucene索引的存放位置。

二、文档索引的基本步骤

(1)创建索引库IndexWriter
(2)根据文件创建文档Document
(3)向索引库中写入文档内容

三、索引、Document、Filed之间的关系

多个Filed组成一个Document,多个Document组成一个索引

Document doc = new Document();  
Field pathField = new StringField("path", filetoIndex.getPath(),Field.Store.YES);  
doc.add(pathField);  

writer.addDocument(doc); 

四、Field的实现类型

BinaryDocValuesField,
DoubleField,
FloatField,IntField,
LongField,
NumericDocValuesField,
SortedDocValuesField,
SortedSetDocValuesField,
StoredField,
StringField,
TextField

重要:
StringField: A field that is indexed but not tokenized
TextField: A field that is indexed and tokenized

Field.Store.Yes/No
在创建一个Field的时候,需要传入一个参数,用于指定内容是否需要存储到索引中。这些被存储的内容可以在搜索结果中返回,呈现给用户。

五、对富文本(非纯文本)的索引
若需要对此类文本进行索引,需要使用Tika等工具先将其正文内容提取出来,然后再进行索引。

版权声明:本文为博主原创文章,未经博主允许不得转载。

索引概念

索引技术                                                                                                ...
  • chenghuaying
  • chenghuaying
  • 2013年10月07日 17:17
  • 1193

mysql之索引(基本概念)

一、索引是什么? 比如我们要在字典中找某一字,如何才能快速找到呢?那就是通过字典的目录。 对数据库来说,索引的作用就是给‘数据’加目录。     二、索引算法 设有N条随...
  • qq_15766181
  • qq_15766181
  • 2015年08月09日 23:42
  • 306

JAVA语言的基本概念

1.JAVA的工作方式 (1)编写源代码文件 (2)用编译器运行源代码,编译器会检查错误,如果有错误需要改正才可以产生正确输出,如果你用的是eclipse等开发工具,会直接有红色线提示你写的源代码...
  • u012934325
  • u012934325
  • 2016年09月10日 12:08
  • 298

数据库-索引(概念,优缺点,分类)

(1)索引概念: 索引是由用户创建,能够被修改和删除的,实际存储在数据库中的物理存在,它是某一个表中一列或者若干列值的集合和相应的指向表中物理标志这些值的数据页的逻辑指针清单。 (2)索引的优点: 第...
  • zdplife
  • zdplife
  • 2015年08月27日 20:08
  • 2809

AOP的主要概念和术语

 ====关注点(Concern)====关注点就是我们要考察或解决的问题。如订单的处理,用户的验证、用户日志记录等都属于关注点。 关注点中的核心关注点(Core Concerns),是指系统中的核心...
  • totogogo
  • totogogo
  • 2007年04月24日 18:06
  • 1025

字符串相关概念

本文简单讲解字符串的相关概念。如:回文、子串、子序列、前缀树、后缀树、后缀数组、匹配、字典序。...
  • CodingEnding
  • CodingEnding
  • 2017年03月16日 18:02
  • 396

1.内存管理的概念

转载自:http://c.biancheng.net/cpp/html/2608.html点击打开链接 内存管理(Memory Management)是操作系统设计中最重要和最复杂的内容之一。虽然计...
  • chengonghao
  • chengonghao
  • 2016年03月28日 14:24
  • 463

lucene(一) lucene一些概念的理解

1 lucene简介 1.1 什么是lucene     Lucene是一个全文搜索框架,而不是应用产品。因此它并不像www.baidu.com 或者google Desktop那么拿来就能用,它...
  • u013360022
  • u013360022
  • 2016年05月16日 15:09
  • 1602

【Lucene02】索引和搜索建立

1、索引 1、创建索引库IndexWriter 2、根据文件创建文档Document 3、向索引库中写入文档内容 对文档建立索引,Lucene提供了5个类:Document, Fiel...
  • kevinelstri
  • kevinelstri
  • 2016年08月29日 20:29
  • 448

Http相关 --概念

1 http 是应用层协议是万维网交换文件(文本,声音,图像等多媒体)的基础 * * 2 http工作流程: * 1 客户端与服务器建立连接. * 2 建立连接后,客户端发送请求...
  • joke124
  • joke124
  • 2015年12月26日 21:34
  • 283
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:【Lucene02】索引的相关概念
举报原因:
原因补充:

(最多只允许输入30个字)