Lucene
文章平均质量分 77
wind_bell27
这个作者很懒,什么都没留下…
展开
-
深入 Lucene 索引机制
Lucene 是一个基于 Java 的全文检索工具包,你可以利用它来为你的应用程序加入索引和检索功能。Lucene 目前是著名的 Apache Jakarta 家族中的一个开源项目,下面我们即将学习 Lucene 的索引机制以及它的索引文件的结构。在这篇文章中,我们首先演示如何使用 Lucene 来索引文档,接着讨论如何提高索引的性能。最后我们来分析 Lucene 的索引文件结构。需要记住的是...2007-04-24 18:13:13 · 58 阅读 · 0 评论 -
Lucene索引原理
Lucene是一个高性能的java全文检索工具包,它使用的是倒排文件索引结构。该结构及相应的生成算法如下: 0)设有两篇文章1和2 文章1的内容为:Tom lives in Guangzhou,I live in Guangzhou too. 文章2的内容为:He once lived in Shanghai. 1)由于lucene是基于关键词索引和查询的,首先我们要取...2007-04-25 17:20:51 · 157 阅读 · 0 评论 -
搜索概念
1 互联网搜索其实搜索的这个核心就是分词与PageRank算法,择日和大家讨论具体的实现,依靠PR算法,sogou 3.0的搜索结果相当不错,如果融入人工智能、数据挖掘自然语言理解等最新信息技术成果的搜索引擎,将会给用户带来了一种方便、易用、灵活的检索方式,为用户提供的是详实、准确、直接的信息。这部分讨论几种特色搜索,概念检索是以概念为核心,这种方式一改以关键词核心的搜索模式,借助概念词典,通...2007-05-17 12:59:22 · 1117 阅读 · 0 评论 -
Lucene 基础指南
Lucene是apache组织的一个用java实现全文搜索引擎的开源项目。其功能非常的强大,但api其实很简单的,它最主要就是做两件事:建立索引和进行搜索。1. 建立索引时最重要的几个术语* Document:一个要进行索引的单元,相当于数据库的一行纪录,任何想要被索引的数据,都必须转化为Document对象存放。* Field:Document中的一个字段,相当于数据库中的Column ...2007-09-21 11:55:40 · 112 阅读 · 0 评论