ElasticSearch 自定义评分function_score

最新推荐文章于 2024-07-07 21:12:12 发布

川成先生

最新推荐文章于 2024-07-07 21:12:12 发布

阅读量1.4k

点赞数 18

文章标签： elasticsearch 搜索引擎大数据

本文链接：https://blog.csdn.net/qq_35270686/article/details/125873268

版权

ElasticSearch 自定义评分function_score

官方文档：function_score

function_score简介

允许修改由查询检索到的文档的function_score分数。例如，如果一个分数函数计算量很大，并且计算一组过滤的文档的分数就足够了，这可能很有用。

GET /_search
{
    "query": {
        "function_score": {
            "query": { "match_all": {} },
            "boost": "5",
            "random_score": {}, 
            "boost_mode":"multiply"
        }
    }
}

此外，可以组合多个功能。在这种情况下，可以选择仅在文档与给定过滤查询匹配时应用该功能

GET /_search
{
    "query": {
        "function_score": {
          "query": { "match_all": {} },
          "boost": "5", 
          "functions": [
              {
                  "filter": { "match": { "test": "bar" } },
                  "random_score": {}, 
                  "weight": 23
              },
              {
                  "filter": { "match": { "test": "cat" } },
                  "weight": 42
              }
          ],
          "max_boost": 42,
          "score_mode": "max",
          "boost_mode": "multiply",
          "min_score" : 42
        }
    }
}

提升整个查询。
有关支持的功能列表，请参阅功能评分。

每个函数的过滤查询产生的分数无关紧要

如果没有使用函数给出过滤器，则这等效于指定 “match_all”: {}
首先，每个文档都由定义的函数评分。该参数 score_mode指定如何组合计算的分数：

multiply	相乘（默认）
sum	相加
avg	平均值
first	匹配第一个filter
max	使用最高分
min	使用最低分

因为分数可以在不同的范围内（例如，衰减函数在 0 和 1 之间，但对于 field_value_factor 是任意的），而且有时函数对分数的不同影响是可取的，每个函数的分数可以自定义来调整。可以在函数数组（上面的示例）中为每个函数定义权重，并乘以相应函数计算的分数。如果在没有任何其他函数声明的情况下给出了权重，则权重作为一个简单地返回权重的函数。如果 score_mode 设置为 avg，则各个分数将通过加权平均值组合。例如，如果两个函数返回分数 1 和 2，并且它们各自的权重分别为 3 和 4，那么它们的分数将合并为 (13+24)/(3+4) 而不是 (13+24)/2。可以通过设置 max_boost 参数将新分数限制为不超过某个限制。 max_boost 的默认值为 FLT_MAX。新计算的分数与查询的分数相结合。

参数 boost_mode 定义：

multiply	相乘（默认）
replace	仅使用函数分数，忽略查询分数
sum	相加
avg	平均值
first	匹配第一个filter
max	使用最高分
min	使用最低分

默认情况下，修改分数不会更改匹配的文档。要排除不符合特定分数阈值的文档，可以将 min_score 参数设置为所需的分数阈值。

要使 min_score 起作用，需要对查询返回的所有文档进行评分，然后一一过滤掉。

function_score 查询提供了几种类型的评分函数。

script_score
weight
random_score
random_score
field_value_factor
decay functions: gauss, linear, exp

script_score

script_score 函数允许您包装另一个查询并自定义它的评分，可以选择使用脚本表达式从文档中的其他数字字段值派生的计算。这是一个简单的示例：

GET /_search
{
    "query": {
        "function_score": {
            "query": {
                "match": { "message": "elasticsearch" }
            },
            "script_score" : {
                "script" : {
                  "source": "Math.log(2 + doc['likes'].value)"
                }
            }
        }
    }
}