Elasticsearch 如何计算相关度分数

最新推荐文章于 2024-07-27 20:19:46 发布

迷途码界

最新推荐文章于 2024-07-27 20:19:46 发布

阅读量2.7k

点赞数

分类专栏： elasticsearch Elasticsearch原理解析及应用文章标签： Elasticsearch 如何计算相关度分数

本文链接：https://blog.csdn.net/zx711166/article/details/82391369

版权

Elasticsearch原理解析及应用同时被 2 个专栏收录

51 篇文章 26 订阅

订阅专栏

elasticsearch

28 篇文章 6 订阅

订阅专栏

相关度分数的计算使用的是TF/IDF算法（Term Frequency&Inverse Document Frequency）。

Term Frequency：我们查询的文本中的词条在document中出现了多少次，出现次数越多，相关度越高。

搜索内容：hello world
Hello， I love china.
Hello world,how are you!
Inverse Document Frequency：我们查询的文本中的词条在索引的所有文档中出现了多少次，出现的次数越多，相关度越低

所搜内容：hello world
hello， what are you doing?
I like the world.
hello 在索引的所有文档中出现了500次，world出现了100次
Field-length（字段长度归约）norm：field越长，相关度越低

搜索内容：hello world
{“title”：“hello,what’s your name?”,“content”:{“owieurowieuolsdjflk”}}
{“title”：“hi,good morning?”,“content”:{“Ikjkljkj…world”}}

查看分数是如何计算的：

GET /lib3/user/_search?explain=true
{
	"query": {
		"match": {
			"interests": "duanlian,changge"
		}
	}
}

查看一个文档能否匹配上某个查询：

GET /lib3/user/2/_explain
{
	"query": {
		"match": {
			"interests": "duanlian,changge"
		}
	}
}

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

迷途码界

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

【Elasticsearch】打分策略详解与explain手把手计算

molong1208的专栏

02-02

3万+

Elasticsearch打分公式的计算，ES的打分与Lucene的不同之处，如何跟explain的计算对照上，手把手教你如何手算explain分数

Elasticsearch 相关度分数计算

@羲凡—只为更好的活着

08-21

1412

@羲凡——只为了更好的活着 Elasticsearch 部分基本原理 1.倒排索引 2.相关度分数计算 TF/IDF算法 a.Term Frequency：查询的词条在document中出现的次数，次数越多，相关度越高； b.Inverse Document Frequency：查询的词条在所有文档中出现的次数，次数越多，相关度越低； c.tfNorm：字段长度归约，字段越长，相关度越低 GET ...

参与评论您还未登录，请先登录后发表或查看评论

ElasticSearch(七)— 相关性检索和组合查询

最新发布

敲代码的小小酥的博客

07-27

1350

全文检索与数据库查询的一个显著区别，就是它并不一定会根据查询条件做完全精确的匹配。除了模糊查询以外，全文检索还会根据查询条件给文档的相关性打分并排序，将那些与查询条件相关性高的文档排在最前面。相关性( Relevance)或相似性(Similarity)是指两个事物间相互关联的程度，在检索领城特指检索请求与检索结果之间的相关程度。在 Elaticsearch 返回的每条结果中都会包含一个_ score 字段，这个字段的值就是当前文档匹配检索请求的相关性评分，我们也可以称为相关度。

Elasticsearch 相关度评分算法

爱喝咖啡的程序员的博客

04-13

4325

ES相关度评分

田培融的博客

08-11

1934

算法介绍 relevance score（相关度得分）算法：简单来说，就是计算出，一个索引中的文本，与搜索文本，他们之间的关联匹配程度 Elasticsearch 使用的是 term frequency/inverse document frequency 算法，简称为 TF/IDF 算法 TF/IDF 有以下三个组成 Term frequency（词的频率）搜索文本中的各个词条在 field 文本中出现了多少次，出现次数越多，就越相关比如：搜索请求：hello world，肯定是 doc1 中得分

Elasticsearch相关度评分算法

不见其长，日有所长

11-12

2045

Elasticsearch控制相关度分数API

Tyshawn的博客

01-02

1944

Elasticsearch可以控制相关度分数计算的, 让满足一些条件的分数更高. 在学习本篇博客前先了解下Elasticsearch全文搜索之基础语法API Rest API Elasticsearch有三种控制相关度分数的方法: boost boosting function_score 添加搜索实例数据 POST /blogs/_bulk {"index": {}} {"post_dat...

Elasticsearch 之（22）自定义相关度分数算法和常见的相关度分数优化方法

vincent

05-24

6765

elasticsearch：搜索常见相关度分数优化方法——笔记

高精尖发展

03-13

2251

一、提权，又见boostGET /forum/article/_search { "query": { "bool": { "should": [ { "match": { "title": { "query": "java spark", "boost": 2

Elasticsearch 7.x 自定义相关度计算 - function_score查询 script_score，field_value_factor及decay functions参数

HelloBiu的博客

11-24

3748

Function score 查询 function_score 允许您修改查询检索的文档分数。例如，如果分数函数在计算上开销很大，并且足以在过滤后的文档集上计算分数，则此功能很有用。要使用 function_score ，用户必须定义一个查询和一个或多个函数，这些函数为查询返回的每个文档计算一个新分数。它让你能够对所有匹配了主查询的每份文档调用一个函数来调整甚至是完全替换原来的_score

elasticsearch:算法 function_score自定义相关度分数

高精尖发展

03-13

2895

可以自定义一个function_score函数，自己将某个field的值，跟es内置算出来的分数进行运算，然后由自己指定的field来进行分数的增强如网络中的帖子，查看的人越多，帖子的分数越高GET /forum/article/_search { "query": { "function_score": { "query": { "multi_match":

ElasticSearch的评分计算

Rao的博客

07-29

938

ElasticSearch 搜素时会带有一个 _score 的数据，表示搜索出来的结果与参数之间的相关性本文内容 ElasticSearch 的三大评分原则 ElasticSearch 了解为什么这样评分 ElasticSearch 的文本评判基础算法 ElasticSearch 的评分原则检索词频率该词出现的频率越大，评分越高反向文档频率该词如果在该索引(表)中出现的频率很高，评分会随之降低也就是说，假如索引一共有 10 个数据，9个都含有 hello ，评分会降低字段.

es中相关性和相关性算分（explain，boosting）

IT之一小佬的博客

11-01

1627

es中相关性和相关性算分（explain，boosting）

四十八.面向对象程序设计——Java语言第一周编程题：分数

JiangYu200015的博客

09-08

1453

题目内容：设计一个表示分数的类Fraction。这个类用两个int类型的变量分别表示分子和分母。这个类的构造函数是： Fraction(int a, int b) 构造一个a/b的分数。这个类要提供以下的功能： double toDouble(); 将分数转换为double Fraction plus(Fraction r); 将自己的分数和r的分数相加，产生一个新的Fraction的对象。注意小学四年级学过两个分数如何相加的哈。 Fraction multiply(Fraction r)

你知道es是如何计算相似度得分的吗？

丘文波的自然语言处理学习

01-19

5079

你知道es是如何计算相似度得分的吗？ 1.es中相似度计算公式-BM25 6.x版本和7.x 版本的es的默认得分计算方式都是BM25。假如用户给定一个输入QQQ，其包含了关键字q1,q2,......qn,q_1,q_2,... ... q_n,q1,q2,......qn,那么该输入QQQ与文档DDD的BM25得分为： score⁡(D,Q)=∑i=1nIDF⁡(qi)⋅f(qi,D)⋅(k1+1)f(qi,D)+k1⋅(1−b+b⋅∣D∣avgdl⁡) \operatorname{score}

ElasticSearch第十一讲 ES检索评分score以及分数计算逻辑

程序员路同学

04-22

1751

ElasticSearch第十一讲 ES检索评分score以及分数计算逻辑

Elasticsearch实战（二十）---ES相关度分数评分算法分析及相关度分数优化

流浪的喵的博客

08-13

3615

ES入门十二：相关性评分

一只小星星

04-08

1602

ES相关性计算原理

Steve Wang's blog

05-04

1196

了解es搜索过程中的，对判断当前应用场景是否适合使用es来召回相关结果至关重要。本篇博文尝试对es在每一个节点执行搜索时如何计算query和经由倒排索引查询到的对应字段文本之间的相关性得分max_score做简要说明。

elasticsearch评分

09-04