java 学习笔记
Duncan_Chou
-
展开
-
lucene 原理
Lucene是一个高性能的java全文检索工具包,它使用的是倒排文件索引结构。该结构及相应的生成算法如下: 0)设有两篇文章1和2 文章1的内容为:Tom lives in Guangzhou,I live in Guangzhou too. 文章2的内容为:He once lived in Shanghai. 1)由于lucene是基于关键词索引和查询的,首先我们要取得这转载 2012-01-25 16:42:09 · 188 阅读 · 0 评论 -
lucene 2.x 预处理、建立索引、查询 实例+源码
lucene3.0已于2009-11-25发布啦,但网上的入门实例都是针对lucene3.0以前的,相对于以前的版本,貌似改动不小。本人从头开始学习lucene,现在用的是《lucene in action中文版》,结合lucene3.0文档写了个入门实例,可供像我一样直接从lucene3.0开始学习的新手参考!入门实例: 1.预处理:先把网上下载的一个《三国演义》电子书“三国转载 2012-01-25 15:58:17 · 276 阅读 · 0 评论 -
lucene 集中analyser的比较
中文分词可以查看:http://www.open-open.com/74.htm1、StopAnalyzerStopAnalyzer能过滤词汇中的特定字符串和词汇,并且完成大写转小写的功能。2、StandardAnalyzerStandardAnalyzer根据空格和符号来完成分词,还可以完成数字、字母、E-mail地址、IP地址以及中文字符的分析处理,还可以支持过滤词表,转载 2012-03-11 20:25:44 · 423 阅读 · 0 评论