分布式搜索引擎ElasticSearch之高级运用(四)

一、如何优化多字段查询

1. 提升字段查询得分:

将title字段查询比重提升10倍:

GET /movies/_search
{
  "explain": true, 
  "query":{
    "multi_match":{
      "query": "good hearts sea",
      "fields": ["title^10", "overview"]
    }
  }
}

得分系数提升了10倍:
file

2. 综合提升字段查询得分:

使用tie_breaker将其他query的分数也考虑进去

GET /movies/_search
{
  "query":{
    "multi_match":{
      "query": "good hearts sea",
      "fields": ["title", "overview"],
      "tie_breaker": 0.3
    }
  }
}

使用 tie_breaker 和不使用查询出来的某一条数据的 _score 分数,会有相应的提高,例如:

title 中包含关键词matched query 的得分,假设是 1.6

overview中包含关键词matched query的得分,假设是 1.8

添加了 tie_breaker = 0.3,那么就是这样的了, 1.6 * 0.3 + 1.8 = 2.28;

大于最高一条的得分1.8,这样搜索的关联性就提升上去了, 更为合理。

二、多条件查询与过滤

1. 多条件查询:

GET /movie/_search
{
  "query":{
    "bool":{
      "filter":[
        {"term":{"title":"heart"}},
        {"term":{"cast.name":"joseph"}},
        {"range": { "release_date": { "lte": "2016/01/01" }}},
        {"range": { "popularity": { "gte": "25" }}}
        ]
    }
  }
}

2. 增加排序处理:

GET /movie/_search
{
  "query":{
    "bool":{
      "filter":[
        {"term":{"title":"heart"}},
        {"range": { "release_date": { "lte": "2017/01/01" }}},
        {"range": { "popularity": { "gte": "10" }}}
        ]
    }
  },
  "sort":[
    {"release_date":{"order":"desc"}}
  ]
}

根据release_date进行倒序排列。

三、查全率与查准率

1. 什么是查全率:

索引内符合条件的结果有N个,查询出来的符合条件的结果有X个, 则查全率为: X/N

比如: 用户的关键词为笔记本(笔记本包含写字的笔记本以及电脑笔记本, 在索引中, 这些记录为1000条,即N),查询出来的结果如果是100条,即X(包含写字的笔记本以及电脑笔记本), 则查全率为10%。

2. 什么是查准率:

查询出来的X个文档中, 有M个是正确的, 则查准率为:M/X

比如: 用户的关键词为笔记本, 这些记录为1000条,查询出来的结果如果是100条, 而在这100条(X)当中只有20条(M)为用户期望的电脑笔记本, 则查准率为20%。

3. 自定义调整评分:

通过function_score实现自定义评分:

GET /movies/_search
{
  "explain": true, 
  "query":{
    "function_score": {
      "query": {      
        "multi_match":{
          "query": "good hearts sea",
          "fields": ["title", "overview"]
        }
      },
      "functions": [
        {"field_value_factor": {
          "field": "popularity",
          "modifier": "log2p",
          "factor": 20
        }}
      ]      
    }
  }
}

通过function_score将popularity评分调整, 采用log对数函数, 将系数放大20, 通过explain查看具体得分。

file

value得分为3.00

file

再乘以12.261267, 得出最终得分结果为36.875378。


本文由mirson创作分享,如需进一步交流,请加QQ群:19310171或访问www.softart.cn

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

麦神-mirson

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值