搜索引擎
文章平均质量分 59
wangzh1118
这个作者很懒,什么都没留下…
展开
-
Lucene 索引文件结构分析
关键字: lucene 索引文件 结构 分析 首先理解反向索引(Inverted index)这个概念,反向索引是一种以索引项为中心来组织文档的方式,每个索引项指向一个文档序列,这个序列中的文档都包含该索引项。相反,在正向索引中,文档占据了中心的位置,每个文档指向了一个它所包含的索引项的序列。你可以利用反向索引轻松的找到那些文档包含了特定的索引项。Lucene正是使用了反向索引作为其基本的索引...原创 2010-08-20 17:05:50 · 164 阅读 · 0 评论 -
lucene 漫谈--入门与介绍(6)
8 分析器 在前面的概念介绍中我们已经知道了分析器的作用,就是把句子按照语义切分成一个个词语。英文切分已经有了很成熟的分析器: StandardAnalyzer,很多情况下StandardAnalyzer是个不错的选择。甚至你会发现StandardAnalyzer也能对中文进行分词。 但是我们的焦点是中文分词,StandardAnalyzer能支持中文分词吗?实践证...原创 2010-08-20 17:06:15 · 63 阅读 · 0 评论