![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Lucene
文章平均质量分 92
桃花惜春风
高级Elasticsearch工程师,搜索架构工程师
展开
-
Elasticsearch原理(九):相关性排序算法详解
Elasticsearch中的相关性算法主要还是基于Lucene的相关性算法,Lucene的算法是基于TF-IDF的,但和TF-IDF还是有些区别。那么我们就从TF-IDF开始介绍。 TF-IDF 定义 TF-IDF(term frequency–inverse document frequency)是一种用于信息检索与数据挖掘的常用加权技术。TF是词频(Term Frequency),IDF是逆文本频率指数(Inverse Document Frequency)。(来源百度百科) 算法核心 TF-IDF实原创 2020-08-20 10:46:15 · 3196 阅读 · 0 评论 -
Lucene原理(一):基本概念
Apache Lucene是Apache的一个核心开源项目,是目前最好的搜索框架。扩展性强,支持全文检索,各种各样的数据结构,支持不同的查询需求。 目前使用Apache Lucene最好的两款开源软件: Apache solr,Apache 旗下的开源搜索引擎,支持各种数据格式的检索(json、pdf、csv等),实时性较差 Elasticsearch,目前最火的开源搜索引擎,实时性...原创 2018-09-15 18:15:52 · 4671 阅读 · 0 评论