Lucene
技术客
通过分享未来技术趋势,探讨互联网技术观点,分享技术学习笔记和发表最新研究,结识有共同理念、想法的一批有识之士,形成永久朋友
展开
-
Lucene6.0分析(一)——数据分析接口
Analyer作为数据分析的主要数据模型,他通过TokenStreams分析文本。也可以说它是从文本中提取索引字段的一种策略。为了实现分析的目的,内部采用TokenStreamComponents组件进行实现。Analyzer本身集成自Closable接口,即调用Close方法,可以释放资源。该对象通过tokenStream方法获取TokenStream对象。 TokenStrea原创 2016-05-27 16:33:31 · 969 阅读 · 0 评论 -
为什么选用检索引擎
检索引擎即一种对于已有数据进行组织和处理之后,为用户提供快速、精准的数据检索和排序的一种数据处理手段。相比之前传统的数据库检索而言,具有着以下的优势:1、大数据量的检索更加快速。普通的检索需要根据数据进行全数据的检索,但是检索引擎根据检索的索引进行检索,不用全部数据进行遍历,因此效率更高。2、能够对于检索的结果进行专业的排序。3、能够认识自然语言,能够根据自然语言进行检索过原创 2016-06-07 08:44:13 · 463 阅读 · 0 评论 -
Lucene的核心包
检索领域的明星lucene,被公认为高效的检索算法,其被广泛应用在其他领域中,包括微软的邮箱检索等。其的核心包有7个,名称和功能介绍如下:序号 包名 功能简介 1 index 构建索引 2 analyze 文本分析接口 3 document 文档逻辑接口 4 Search 文档检索接口原创 2017-09-26 10:42:22 · 310 阅读 · 0 评论 -
Lucene原理剖析
Lucene作为一个快速的检索框架,为中小型公司提供了一个快速接入搜索引擎的途径。其从创立之初,得到了开源社区的快速发展。其突出优势为快速的数据处理能力和TF-IDF的快速排序算法。本文从Lucene的打分原理、具体的实现和数据存储结构三个方面讲解,力争将Lucene的核心原理层层剖开。原创 2017-09-26 19:50:58 · 4955 阅读 · 0 评论