lucene
const伐伐
这个作者很懒,什么都没留下…
展开
-
lucene6中自定义评分的方法
仍然在上篇博客案例的基础上,来实现lucene6中的自定义评分。案例参考:lucene6中的创建正排索引以及进行字段排序的方法与上面案例不同的一点是,在这里,添加了一个score字段,用来表示我们的评分域。创建索引FileIndexUtils01类public class FileIndexUtils01 { private static Directory direct...原创 2018-07-24 10:20:01 · 2178 阅读 · 0 评论 -
Lucene中IndexReader及IndexSearcher在项目中应设置为单例
在lucene的搜索示例中,很多demo代码在做搜索的时候都是先新建一个IndexReader,之后再新建一个IndexSearcher,搜索完成之后,再将IndexReader关闭。 但在实际项目应用中,这样操作是不妥当的。对于IndexReader来说,IndexReader.open()会产生很大开销。参考:lucene的IndexReader的初始化过程对于IndexSearcher来说,...原创 2018-07-13 09:22:25 · 962 阅读 · 0 评论 -
lucene6中自定义QueryParser实现自定义格式搜索
仍然在原有案例基础上进行案例参考:lucene6中的创建正排索引以及进行字段排序的方法创建索引FileIndexUtilspublic class FileIndexUtils { private static Directory directory = null; static { try { directory = FSD...原创 2018-07-24 17:30:14 · 1069 阅读 · 0 评论 -
Intellij idea中为lucene6配置IK Analyzer分词器
首先介绍一下IK AnalyzerIK Analyzer是一个开源的、基于java语言开发的轻量级中文分词工具包。已经推出了4个大版本。从3.0版本开始,IK Analyzer发展为面向java的公用分词组件,独立于lucene项目,同时提供了对lucene的默认优化实现。在2012版本中,IK Analyzer实现了简单的分词歧义排除算法,标志着IK分词器从单纯的词典分词向模拟语义分词衍化。...原创 2018-07-20 13:59:44 · 3002 阅读 · 0 评论 -
lucene6中配置IK Analyzer同义词分词器
首先需要基础知识intellij idea中为lucene6配置IK Analyzer分词器说到同义词分词器,从原理角度来说要了解了AnalyzerAnalyzer分词的原理Analyzer类是一个抽象类,切分词的具体规则是由子类实现的。Analyzer内部主要通过TokenStream类实现。Tokenizer类和TokenFilter类是TokenStream的两个子类。A...原创 2018-07-20 15:14:18 · 1528 阅读 · 5 评论 -
lucene6中的创建正排索引以及进行字段排序的方法
通过一个例子来说明lucene6中的各种排序,lucene中的排序需要正排索引(uninverted index),所以对于创建索引时就要考虑后面的排序需求。先说明一下这个例子的背景。在D:\indexFile\test-search-advance-files文件夹下有5个文件每个文件中都写一句包含java的英文语句 我们的排序需求是:对文本内容执行“java”的查询,对查询...原创 2018-07-23 09:50:51 · 1706 阅读 · 0 评论