手动控制全文检索结果的精确度

目录

搜索内容中包含learning或者Hadoop的文档

搜索标题中包含learning和Hadoop的bolg

搜索标题中包含java,Hadoop,spark,elasticsearch,4个关键字中至少三个的bolg

用bool组合多个搜索条件java,Hadoop,spark,elasticsearch,来搜索title

使用should如何搜索java,Hadoop,spark,elasticsearch包含三个的bolgs

总结


相关知识可以点击这里查看

全文检索:match query负责进行全文检索.

当然,如果要检索的field字段类型是not_analyzed的话,那么match query也相当于term query

搜索内容中包含learning或者Hadoop的文档

//写法一:
GET /my_blogs/_search
{
  "query": {
    "match": {
      "content": "learning Hadoop"
    } 
  }
}
//写法二:
GET /my_blogs/_search
{
  "query": {
    "match": {
      "content": {
        "query": "learning Hadoop"
      }
    } 
  }
}

搜索标题中包含learning和Hadoop的bolg

  • 搜索结果精准控制第一步,灵活使用operator,如果希望所有的关键字都要匹配,就使用and,可以实现单纯的match query无法实现的效果

//写法一:错误(不可以这么写)
GET /my_blogs/_search
{
  "query": {
    "match": {
      "content": "learning Hadoop",
      "operator": "and"
    }
  }
}

//写法二:正确
GET /my_blogs/_search
{
  "query": {
    "match": {
      "content": {
        "query": "learning Hadoop",
        "operator": "and"
      }
    } 
  }
}

搜索标题中包含java,Hadoop,spark,elasticsearch,4个关键字中至少三个的bolg

  • 控制搜索结果的精准度第二步,指定一些关键词,必须至少匹配其中的多少个关键字.

//至少匹配2个关键字
GET /my_blogs/_search
{
  "query": {
    "match": {
      "content": {
        "query": "java Hadoop spark elasticsearch",
        "minimum_should_match": "50%"
      }
    } 
  }
}

GET /my_blogs/_search
{
  "query": {
    "match": {
      "content": {
        "query": "learning Hadoop spark elasticsearch",
        "minimum_should_match": 2
      }
    } 
  }
}

用bool组合多个搜索条件java,Hadoop,spark,elasticsearch,来搜索title

  • bool组合多个搜索条件,如何计算relevance score==> must和should搜索对应的分数加起来,除以must和should的总数

  • must是确保,谁必须有这个关键字,同时会根据这个must的条件去计算处documennt对这个搜索条件的relevance score,在满足must的基础之上,should中的条件,不匹配也可以,但是如果匹配的更多,那么document的relevance score就会更高

GET /my_blogs/_search
{
  "query": {
    "bool": {
      "must": [
        {
          "match": {
            "content": "java"
          }
        }
      ],
      "must_not": [
         {
          "match": {
            "content": "elasticsearch"
          }
        },
        {
          "match": {
            "content": "java"
          }
        }
      ],
      "should": [
        {
          "match": {
            "content": {
              "query": "spark elasticsearch",
              "operator": "and"
            }
          }
        },
        {
          "match": {
            "content": "elasticsearch"
          }
        }
      ],
      "minimum_should_match": 1
    }
  }
}

使用should如何搜索java,Hadoop,spark,elasticsearch包含三个的bolgs

默认情况下,should是可以不匹配任何一个的;但是没有must的话,那么should中必须至少满足一个才可以,比如下面的搜索中,should有三个条件,默认情况下,只要满足其中一个就可以作为匹配结果返回,但是可以精准控制should的三个条件中,至少匹配几个(minimum_should_match指定)

GET /my_blogs/_search
{
  "query": {
    "bool": {
      "should": [
        {"match": {"content": "elasticsearch"}},
        {"match": {"content": "java"}},
        {"match": {"content": "Hadoop"}}
      ],
      "minimum_should_match": 2
    }
  }
}

总结

  • 全文检索的时候,进行多个值得检索,有两种做法:match query 和should

  • 控制搜索结果精准度: and operator, minimum_should_match

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值