ElasticSearch 自定义评分function_score
官方文档:function_score
function_score简介
允许修改由查询检索到的文档的function_score分数。例如,如果一个分数函数计算量很大,并且计算一组过滤的文档的分数就足够了,这可能很有用。
GET /_search
{
"query": {
"function_score": {
"query": { "match_all": {} },
"boost": "5",
"random_score": {},
"boost_mode":"multiply"
}
}
}
此外,可以组合多个功能。在这种情况下,可以选择仅在文档与给定过滤查询匹配时应用该功能
GET /_search
{
"query": {
"function_score": {
"query": { "match_all": {} },
"boost": "5",
"functions": [
{
"filter": { "match": { "test": "bar" } },
"random_score": {},
"weight": 23
},
{
"filter": { "match": { "test": "cat" } },
"weight": 42
}
],
"max_boost": 42,
"score_mode": "max",
"boost_mode": "multiply",
"min_score" : 42
}
}
}
- 提升整个查询。
- 有关支持的功能列表,请参阅功能评分。
每个函数的过滤查询产生的分数无关紧要
如果没有使用函数给出过滤器,则这等效于指定 “match_all”: {}
首先,每个文档都由定义的函数评分。该参数 score_mode指定如何组合计算的分数:
multiply | 相乘(默认) |
---|---|
sum | 相加 |
avg | 平均值 |
first | 匹配第一个filter |
max | 使用最高分 |
min | 使用最低分 |
因为分数可以在不同的范围内(例如,衰减函数在 0 和 1 之间,但对于 field_value_factor 是任意的),而且有时函数对分数的不同影响是可取的,每个函数的分数可以自定义来调整。可以在函数数组(上面的示例)中为每个函数定义权重,并乘以相应函数计算的分数。如果在没有任何其他函数声明的情况下给出了权重,则权重作为一个简单地返回权重的函数。如果 score_mode 设置为 avg,则各个分数将通过加权平均值组合。例如,如果两个函数返回分数 1 和 2,并且它们各自的权重分别为 3 和 4,那么它们的分数将合并为 (13+24)/(3+4) 而不是 (13+24)/2。可以通过设置 max_boost 参数将新分数限制为不超过某个限制。 max_boost 的默认值为 FLT_MAX。新计算的分数与查询的分数相结合。
参数 boost_mode 定义:
multiply | 相乘(默认) |
---|---|
replace | 仅使用函数分数,忽略查询分数 |
sum | 相加 |
avg | 平均值 |
first | 匹配第一个filter |
max | 使用最高分 |
min | 使用最低分 |
默认情况下,修改分数不会更改匹配的文档。要排除不符合特定分数阈值的文档,可以将 min_score 参数设置为所需的分数阈值。
要使 min_score 起作用,需要对查询返回的所有文档进行评分,然后一一过滤掉。
function_score 查询提供了几种类型的评分函数。
- script_score
- weight
- random_score
- random_score
- field_value_factor
- decay functions: gauss, linear, exp
script_score
script_score 函数允许您包装另一个查询并自定义它的评分,可以选择使用脚本表达式从文档中的其他数字字段值派生的计算。这是一个简单的示例:
GET /_search
{
"query": {
"function_score": {
"query": {
"match": { "message": "elasticsearch" }
},
"script_score" : {
"script" : {
"source": "Math.log(2 + doc['likes'].value)"
}
}
}
}
}