Lucene
文章平均质量分 79
chen19901211
这个作者很懒,什么都没留下…
展开
-
lucene--索引工具类
创建索引的步骤: 0.创建分词器 Analyzer analyzer = new StandardAnalyzer(Version.LUCENE_36); 1.创建Directory,索引存放的位置 Directory directory = FSDirectory.open(new File("E:/Lucene/demo")); 2.创建IndexWrite,索引写入器 ...原创 2012-05-31 20:42:25 · 83 阅读 · 0 评论 -
lucene--搜索工具类
搜索 1.创建搜索的索引目录 Directory directory = FSDirectory.open(new File("E:/Lucene/demo")); 2.创建搜索器 IndexSearcher searcher = IndexReader.open(directory); 3.创建搜索条件 Query query = new TermQuery(new Te...原创 2012-05-31 20:44:15 · 88 阅读 · 0 评论 -
lucene 分词原理1
Lucene是一个高性能的java全文检索工具包,它使用的是倒排文件索引结构。该结构及相应的生成算法如下: 0)设有两篇文章1和2 文章1的内容为:Tom lives in Guangzhou,I live in Guangzhou too. 文章2的内容为:He once lived in Shanghai. 1)由于lucene是基于关键词索引和查询的,首先我们要取得这两篇文章的关键...原创 2012-05-31 20:55:06 · 78 阅读 · 0 评论 -
lucene 中的关键词
1.1 什么是lucene Lucene是一个全文搜索框架,而不是应用产品。因此它并不像www.baidu.com 或者google Desktop那么拿来就能用,它只是提供了一种工具让你能实现这些产品。 2 lucene的工作方式 lucene提供的服务实际包含两部分:一入一出。所谓入是写入,即将你提供的源(本质是字符串)写入索引或者将其从索引中删除;所谓出是读出,即向...原创 2012-05-31 21:00:20 · 134 阅读 · 0 评论 -
lucene 分词原理2
建立索引和查询的过程中,都是以基本的语素项为单位的。基本的语素项就是通过分词得到。这个过程决定了索引单元金额最终的匹配过程。 分词在文本索引的建立过程和用户提交检索过程中都存在。利用相同的分词器,把短语或者句子切分成相同的结果,才能保证检索过程顺利进行。 1、 英文分词的原理 基本的处理流程是:输入文本、词汇分割、词汇过滤(去除停留词)、词干提取(形态还原)、大写转为小写、结果输...原创 2012-05-31 21:07:03 · 114 阅读 · 0 评论