ES 搜索11 (查询语句提升权重)

查询语句提升权重

当然 bool 查询不仅限于组合简单的单个词 match 查询, 它可以组合任意其他的查询,以及其他 bool查询。 普遍的用法是通过汇总多个独立查询的分数,从而达到为每个文档微调其相关度评分 _score 的目的。

假设想要查询关于 “full-text search(全文搜索)” 的文档, 但我们希望为提及 “Elasticsearch” 或 “Lucene” 的文档给予更高的 权重 ,这里 更高权重 是指如果文档中出现 “Elasticsearch” 或 “Lucene” ,它们会比没有的出现这些词的文档获得更高的相关度评分 _score ,也就是说,它们会出现在结果集的更上面。

一个简单的 bool 查询 允许我们写出如下这种非常复杂的逻辑:

GET /_search
{
    "query": {
        "bool": {
            "must": {
                "match": {
                    "content": {      1
                        "query":    "full text search",
                        "operator": "and"
                    }
                }
            },
            "should": [      2
                { "match": { "content": "Elasticsearch" }},
                { "match": { "content": "Lucene"        }}
            ]
        }
    }
}

1

content 字段必须包含 full 、 text 和 search 所有三个词。

2

如果 content 字段也包含 Elasticsearch 或 Lucene ,文档会获得更高的评分 _score 。

should 语句匹配得越多表示文档的相关度越高。目前为止还挺好。

但是如果我们想让包含 Lucene 的有更高的权重,并且包含 Elasticsearch 的语句比 Lucene 的权重更高,该如何处理?

我们可以通过指定 boost 来控制任何查询语句的相对的权重, boost 的默认值为 1 ,大于 1 会提升一个语句的相对权重。所以下面重写之前的查询:

GET /_search
{
    "query": {
        "bool": {
            "must": {
                "match": {       1
                    "content": {
                        "query":    "full text search",
                        "operator": "and"
                    }
                }
            },
            "should": [
                { "match": {
                    "content": {
                        "query": "Elasticsearch",
                        "boost": 3      2
                    }
                }},
                { "match": {
                    "content": {
                        "query": "Lucene",
                        "boost": 2      3
                    }
                }}
            ]
        }
    }
}

1

这些语句使用默认的 boost 值 1 。

2

这条语句更为重要,因为它有最高的 boost 值。

3

这条语句比使用默认值的更重要,但它的重要性不及 Elasticsearch 语句。

 

boost 参数被用来提升一个语句的相对权重( boost 值大于 1 )或降低相对权重( boost 值处于 0 到 1 之间),但是这种提升或降低并不是线性的,换句话说,如果一个 boost 值为 2 ,并不能获得两倍的评分 _score 。

相反,新的评分 _score 会在应用权重提升之后被 归一化 ,每种类型的查询都有自己的归一算法,细节超出了本书的范围,所以不作介绍。简单的说,更高的 boost 值为我们带来更高的评分 _score 。

如果不基于 TF/IDF 要实现自己的评分模型,我们就需要对权重提升的过程能有更多控制,可以使用 function_score 查询操纵一个文档的权重提升方式而跳过归一化这一步骤。

更多的组合查询方式会在下章多字段搜索中介绍,但在此之前,让我们先看另外一个重要的查询特性:文本分析(text analysis)。

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
### 回答1: Elasticsearch 查询语句可以使用 Query DSL 进行构建。以下是一些常见的查询语句示例: 1. 匹配查询:用于匹配一个特定字段中的值。 ``` GET /_search { "query": { "match": { "title": "elasticsearch" } } } ``` 2. 短语查询:用于匹配一个特定字段中的短语。 ``` GET /_search { "query": { "match_phrase": { "title": "elasticsearch tutorial" } } } ``` 3. 范围查询:用于匹配一个特定字段中的数值范围。 ``` GET /_search { "query": { "range": { "age": { "gte": 18, "lte": 30 } } } } ``` 4. 布尔查询:用于组合多个查询条件。 ``` GET /_search { "query": { "bool": { "must": [ { "match": { "title": "elasticsearch" } }, { "match": { "description": "tutorial" } } ] } } } ``` 5. 聚合查询:用于对结果进行聚合计算。 ``` GET /_search { "aggs": { "avg_age": { "avg": { "field": "age" } } } } ``` 以上仅是一些常见的查询语句示例,Elasticsearch 还支持许多其他类型的查询。请参阅官方文档以了解更多信息。 ### 回答2: Elasticsearch 是一个开源的分布式搜索和分析引擎,它提供了强大的查询功能来检索和分析大量的数据。 Elasticsearch 查询语句可以使用 JSON 格式来构建,主要分为两种类型:查询查询语句和过滤查询语句查询查询语句用于根据特定的条件从索引中检索文档。常见的查询类型包括匹配查询、多字段查询、范围查询和布尔查询等。匹配查询用于在指定字段中搜索指定的词语,多字段查询可以在多个字段中搜索相同的词语,范围查询支持按照范围来搜索结果,而布尔查询则可以通过逻辑运算符组合多个查询条件。 过滤查询语句用于根据特定的条件过滤文档。与查询查询语句不同的是,过滤查询不会计算相关度分数,只关心是否匹配。常见的过滤查询类型有 term 过滤、范围过滤和 bool 过滤等。term 过滤用于精确匹配一个词语,范围过滤用于按照指定范围过滤结果,bool 过滤则可以通过逻辑运算符组合多个过滤条件。 除了查询和过滤,Elasticsearch 还支持一些聚合函数(aggregations),用于对搜索结果进行统计和分析。聚合查询可以对结果集进行分组、排序、计算总和、平均值等操作,从而提供更丰富的数据分析功能。 总之,Elasticsearch 查询语句是非常灵活和强大的,可以根据不同的需求组合不同的查询和过滤条件,实现高效的数据检索和分析。 ### 回答3: Elasticsearch是一个开源的分布式搜索和分析引擎,提供了强大的查询功能。查询语句是用户用来向Elasticsearch发送请求并获取结果的指令。 Elasticsearch的查询语句可以分为两种,一种是基于URI的查询语句,另一种是基于请求体的查询语句。 基于URI的查询语句通常用于简单的查询请求,语法类似于URL。例如,要查询名为"products"的索引下的所有文档,可以使用以下查询语句: GET /products/_search 基于请求体的查询语句更为灵活,可以实现更复杂的查询功能。请求体是一个JSON对象,包含了查询的参数和条件。以下是一个常见的基于请求体的查询语句示例: POST /products/_search { "query": { "match": { "name": "手机" } } } 上述查询语句使用了"match"查询,指定了要查询的字段为"name",查询的关键词为"手机"。这将返回所有名为"手机"的文档。 此外,Elasticsearch还提供了许多其他类型的查询语句,包括布尔查询、范围查询、模糊查询等。用户可以根据需要选择合适的查询语句以实现精确的搜索结果。 总之,Elasticsearch的查询语句是通过URI或请求体来发送查询请求的指令,使用不同类型的查询语句可以实现不同的搜索功能。用户可以根据自己的需求选择合适的查询语句,并通过分析返回的结果来满足他们的搜索和分析需求。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值