- 博客(2)
- 资源 (5)
- 收藏
- 关注
原创 Lucene学习笔记(二)--------构建索引
构建索引对搜索内容建模文档和域文档是索引和搜索的原子单位,包含一个或多个域的容器,域则依次包含“真正的”被搜索内容。每个域都有一个标识名称(即一个文本值或二进制值)。将文档加入到索引中时,可以通过一系列选项控制Lucene的行为。在对原始数据进行索引操作时,先将数据转换成Lucene所能识别的文档和域,搜索过程中被搜索对象为阈值。Lucene可以针对域进行3种操作: 阈值可以被索引(或者不被索引),
2017-09-05 08:23:12 888
原创 Lucene学习笔记(一)-------Lucene基础
Lucene简介 获取内容 Lucene作为一个核心搜索库,并不提供任何功能来实现内容获取建立文档 文档主要包括几个带值的域,比如标题(title),正文(body),摘要(abstract),作者(author)和链接(URL) 可以向比较重要的单个的文档或域中插入权值,加权操作可能在索引操作前就静态完成了,也可能要在搜索期间才动态完成。包括Lucene在内的几乎所有搜索引擎都会自动地
2017-09-05 08:18:46 889 1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人