lucene源码系列
文章平均质量分 91
以lucene源码为主,剖析lucene的底层架构原理
liweisnake
这个作者很懒,什么都没留下…
展开
-
lucene4.5源码分析系列:索引的创建过程
IndexWriter是写入索引的入口。我们来看看lucene的IndexWriter是如何使用的。尤其是下面这些问题: 1. 调用完增删改索引后,此时索引是已经写入磁盘还是仍然留在内存 2. commit和close分别做了什么事,各有什么职责。如果没有commit,close会自动commit吗?如果没有close,又会发生什么? 如果把索引比作数据库,那么IndexWrit原创 2013-10-23 20:18:39 · 6177 阅读 · 4 评论 -
lucene4.5源码分析系列:lucene的默认评分算法-向量空间模型(Vector Space Model)
aa原创 2013-10-23 20:16:17 · 5848 阅读 · 1 评论 -
lucene4.5源码分析系列:分析器
分析器原创 2013-10-27 14:49:46 · 3265 阅读 · 0 评论 -
lucene4.5源码分析系列:lucene概述
lucene索引格式:http://www.cnblogs.com/forfuture1978/archive/2009/12/14/1623597.html原创 2013-10-23 19:58:49 · 16882 阅读 · 3 评论 -
lucene4.5源码分析系列:索引缓存以及刷新
缓存以及刷新原创 2013-11-04 10:54:22 · 4140 阅读 · 0 评论 -
lucene4.5源码分析系列:搜索过程
IndexSearcher是搜索的入口,主要提供的api都是关于search的。 大致上,前两个search属于简单搜索一类的,接下来两个api是带Collector的,最后三个api是带排序的public TopDocs search(Query query, int n) throws IOException;public TopDocs search(Query query,原创 2013-10-23 20:19:37 · 4862 阅读 · 0 评论 -
lucene4.5源码分析系列:lucene默认索引的文件格式-总述
学习lucene索引文件格式的目的是通过对lucene数据结构的理解,从而为lucene索引实现打下基础 索引文件格式在lucene中分为复合索引以及非复合索引。区别是,非复合索引将各种索引文件单独存放,每一种索引文件有自己的用途,相对清晰,问题是每个索引会包含大量的文件,尤其在与其他程序共用时可能达到操作系统对最大打开文件数量的限制;复合索引则是将非复合索引的所有文件合并为一个文件,这样一原创 2013-10-23 20:02:19 · 7937 阅读 · 1 评论