Lucene
c.
这个作者很懒,什么都没留下…
展开
-
Lucene的核心API介绍
IndexWriter1) 利用这个类可以对索引库进行增、删、改操作。 2) 利用构造方法IndexWriter indexWriter = new IndexWriter(directory,LuceneConfig.analyzer,MaxFieldLength.LIMITED)可以构造一个IndexWriter的对象。 3) addDocument 向索引库中添加一个Documen原创 2017-04-27 10:11:39 · 422 阅读 · 0 评论 -
Lucene 查询索引库
以后用的分词库为IKAnalyzer中文分词库。 查询说明:这是QueryParser的继承结构,在这里我们用的是MultiFieldQueryParser.这个类的好处可以选择多个属性进行查询。而QueryParser只能选择一个。 分页先创建出数据: 读取数据看看是否创建成功: 说明: 1) 在全文检索系统中,一般查询出来的内容比较多,所以必须将查询出来的内容进行分页处理。 2原创 2017-04-27 10:06:18 · 1017 阅读 · 0 评论 -
Lucene分词器
英文分词器步骤:Creates a searcher searching the index in the named directory 切分关键词Creates a searcher searching the index the named directory去除停用词停用词:有些词在文本中出现的频率非常高。但对本文的语义产生不了多大的影响。例如英文的a、an、the、of等。原创 2017-04-26 18:13:33 · 462 阅读 · 0 评论 -
Lucene索引库的优化
当执行创建索引多次时,索引库的文件如图所示:(索引里内容是一样的) 从图中可以看出来,每执行一次就生成一个cfs文件。当执行delete操作时,会生成如图所示的结构: 从图中可以看出来,lucene在执行删除的时候,是先把要删除的元素形成了一个文件del文件,然后再和cfs文件进行整合得出最后结果。 结论:如果增加、删除反复操作很多次,就会造成文件大量增加,这样检索的速度也会下降,所以我们有必原创 2017-04-26 17:49:39 · 573 阅读 · 0 评论 -
Lucene的IndexWriter
Hibernate的SessionFactory说明:在Hibernate中,一般保持一个数据库就只有一个SessionFactory。因为在SessionFactory中维护二级缓存,而SessionFactory又是线程安全的。所以SessionFactory是共享的。lucene的IndexWriter说明:如果同时在一个索引库中同时建立两个IndexWriter,例如: 而lucene的目原创 2017-04-26 15:49:45 · 624 阅读 · 0 评论 -
Lucene 索引库的操作
保持数据库与索引库的同步说明:在一个系统中,如果索引功能存在,那么数据库和索引库应该是同时存在的。这个时候需要保证索引库的数据和数据库中的数据保持一致性。可以在对数据库进行增、删、改操作的同时对索引库也进行相应的操作。这样就可以保证数据库与索引库的一致性。工具类DocumentUtils 说明:在对索引库进行操作时,增、删、改过程要把一个JavaBean封装成Document,而查询的过程是要把一原创 2017-04-26 15:39:09 · 378 阅读 · 0 评论 -
第一个lucene程序
准备lucene的开发环境搭建lucene的开发环境,要准备lucene的jar包,要加入的jar包至少有: 1) lucene-core-3.1.0.jar (核心包) 2) lucene-analyzers-3.1.0.jar (分词器) 3) lucene-highlighter-3.1.0.jar (高亮器) 4) lucene-memory-3.1.0.原创 2017-04-26 14:59:26 · 421 阅读 · 0 评论 -
Lucene入门
全文检索常见的全文检索1) 在window系统中,可以指定磁盘中的某一个位置来搜索你想要得到的东西。这个功能是windows比较常用的功能。在这个界面中能搜索的内容有.,*.bat,可以搜索文件中的内容。2) 在myeclipse中,点击Help->Help Contents,可以利用搜索功能找到你要查询的帮助文档。 3) 在myeclipse中,点击Search->File,在Cont原创 2017-04-25 21:23:38 · 414 阅读 · 0 评论