lucene
帅气的东哥
这个作者很懒,什么都没留下…
展开
-
lucene2.9的改进
Lucene 2.9的大部分重心放在了性能优化方面,这体现在从低端的内部基础结构改进到索引管理方式等多个方面。Lucene的索引数据库由一系列分离的“片断”组成,每个片段存放在独立的文件中。当你向索引中添加文档时,便会不断创建一些可以合并的新片断。Lucene会在FieldCache中缓存字段信息,不过在Lucene 2.4以及之前的版本中,加载字段缓存的开销相对较高,尤其在2.4版本中还会不断重转载 2013-04-05 16:36:01 · 1428 阅读 · 0 评论 -
lucene索引文件的格式(2)
本文转载自http://www.cnblogs.com/forfuture1978/archive/2009/12/14/1623599.html 请支持原创!!! 四、具体格式 上面曾经交代过,Lucene保存了从Index到Segment到Document到Field一直到Term的正向信息,也包括了从Term到Document映射的反向信息,还有其他一些Lucene特有的信息。转载 2013-04-06 14:17:09 · 1782 阅读 · 0 评论 -
lucene的索引文件的格式(1)
本文转载自http://www.cnblogs.com/forfuture1978/archive/2009/12/14/1623597.html 支持原创!!! Lucene的索引里面存了些什么,如何存放的,也即Lucene的索引文件格式,是读懂Lucene源代码的一把钥匙。 当我们真正进入到Lucene源代码之中的时候,我们会发现: Lucene的索引过程,就是按照全文转载 2013-04-06 14:20:46 · 1297 阅读 · 0 评论 -
lucene的总体架构
本文转载自http://www.cnblogs.com/forfuture1978/archive/2009/12/14/1623596.html lucene总的来说是: 一个高效的,可扩展的,全文检索库。全部用Java实现,无须配置。仅支持纯文本文件的索引(Indexing)和搜索(Search)。不负责由其他格式的文件抽取纯文本文件,或从网络中抓取文件的过程。 在Lucen转载 2013-04-06 14:22:50 · 1496 阅读 · 0 评论 -
全文检索的基本原理
本文转载自http://www.cnblogs.com/forfuture1978/archive/2009/12/14/1623594.html 一、总论 根据http://lucene.apache.org/java/docs/index.html定义: Lucene是一个高效的,基于Java的全文检索库。 所以在了解Lucene之前要费一番工夫了解一下全文检索。 那么什么叫做全文检转载 2013-04-06 14:25:03 · 1471 阅读 · 0 评论 -
lukeall的下载与使用
Lukeall的下载与使用 具体的步骤已经在我的一个文档中有详细说明,请参照即可(因为不会再csdn中贴照片,所以就以文档资源的形式上传了)原创 2013-04-06 22:21:56 · 2443 阅读 · 0 评论 -
Lucene全文搜索框架
1 lucene简介 1.1 什么是lucene Lucene是一个全文搜索框架,而不是应用产品。因此它并不像www.baidu.com或者google Desktop那么拿来就能用,它只是提供了一种工具让你能实现这些产品。 1.2 lucene能做什么 要回答这个问题,先要了解lucene的本质。实际上lucene的功能很单一,说到底,就是你给它若干个字符串,然后它为转载 2013-04-18 22:50:02 · 1638 阅读 · 0 评论