【ElasticSearch】基本查询,结果过滤,高级查询,过滤,排序

1. 基本查询

1.1 查询所有

  • 语法
GET /siyi/_search
{
    "query":{
        "match_all": {}
    }
}
  • query:代表查询对象
  • match_all:代表查询所有
  • took:查询花费时间,单位是毫秒
  • time_out:是否超时
  • _shards:分片信息
  • hits:搜索结果总览对象
    • total:搜索到的总条数
    • max_score:所有结果中文档得分的最高分
    • hits:搜索结果的文档对象数组,每个元素是一条搜索到的文档信息
      • _index:索引库
      • _type:文档类型
      • _id:文档id
      • _score:文档的分
      • _source:文档的源数据

1.2 匹配查询

  • or(或)
    match类型查询,会把查询条件进行分词,然后进行查询,多个词条之间是or的关系

    GET /siyi/_search
    {
        "query":{
            "match":{
                "title":"小米电视"
            }
        }
    }
    

    结果:

    这样查询与小米相关的都会查询到,多个词之间是or的关系。

  • and(且)
    某些情况下,我们需要更精确查找,我们希望这个关系变成and,可以这样做:

    GET /siyi/_search
    {
        "query":{
            "match": {
              "title": {
                "query": "小米电视",
                "operator": "and"
              }
            }
        }
    }
    

  • or和and之间
    orand 间二选一有点过于非黑即白。 如果用户给定的条件分词后有 5 个查询词项,想查找只包含其中 4 个词的文档,该如何处理?将 operator 操作符参数设置成 and 只会将此文档排除。

    有时候这正是我们期望的,但在全文搜索的大多数应用场景下,我们既想包含那些可能相关的文档,同时又排除那些不太相关的。换句话说,我们想要处于中间某种结果。

    match 查询支持 minimum_should_match 最小匹配参数, 这让我们可以指定必须匹配的词项数用来表示一个文档是否相关。我们可以将其设置为某个具体数字,更常用的做法是将其设置为一个百分数,因为我们无法控制用户搜索时输入的单词数量:

    GET /siyi/_search
    {
        "query":{
            "match":{
                "title":{
                	"query":"小米曲面电视",
                	"minimum_should_match": "75%"
                }
            }
        }
    }
    

    本例中,搜索语句可以分为3个词,如果使用and关系,需要同时满足3个词才会被搜索到。这里我们采用最小品牌数:75%,那么也就是说只要匹配到总词条数量的75%即可,这里3*75% 约等于2。所以只要包含2个词条就算满足条件了。

1.3 多字段查询

  • multi_matchmatch类似,不同的是它可以在多个字段中查询

我们会在title字段和subtitle字段中查询小米这个词

GET /siyi/_search
{
    "query":{
        "multi_match": {
            "query":    "小米",
            "fields":   [ "title", "subTitle" ]
        }
	}
}

1.4 词条匹配

  • term 查询被用于精确值 匹配,这些精确值可能是数字、时间、布尔或者那些未分词的字符串
GET /siyi/_search
{
    "query":{
        "term":{
            "price":2699.00
        }
    }
}

1.5 多词条精确匹配

  • terms 查询和 term 查询一样,但它允许你指定多值进行匹配。如果这个字段包含了指定值中的任何一个值,那么这个文档满足条件:
GET /siyi/_search
{
    "query":{
        "terms":{
            "price":[2699.00,2899.00,9999.00]
        }
    }
}

1.6 query_string

将需要查询的记录先分词再查询。

GET /siyi/goods/_search
{
  "query":{
    "query_string": {
      "default_field": "title",
      "query": "手机电视"
    }      
  }
}

2. 结果过滤

默认情况下,elasticsearch在搜索的结果中,会把文档中保存在_source的所有字段都返回。

如果我们只想获取其中的部分字段,我们可以添加_source的过滤

2.1 直接指定字段

GET /siyi/_search
{
  "_source": ["title","price"],
  "query": {
    "term": {
      "price": 2699
    }
  }
}

2.2 指定includes和excludes

我们也可以通过:

  • includes:来指定想要显示的字段
  • excludes:来指定不想要显示的字段

二者都是可选的。

GET /siyi/_search
{
  "_source": {
    "includes":["title","price"]
  },
  "query": {
    "term": {
      "price": 2699
    }
  }
}


同样,这样的结果也是一样的。

GET /siyi/_search
{
  "_source": {
     "excludes": ["images"]
  },
  "query": {
    "term": {
      "price": 2699
    }
  }
}

3. 高级查询

3.1 布尔组合

  • bool把各种其它查询通过must(与)、must_not(非)、should(或)的方式进行组合
GET /siyi/_search
{
    "query":{
        "bool":{
        	"must":     { "match": { "title": "大米" }},
        	"must_not": { "match": { "title":  "电视" }},
        	"should":   { "match": { "title": "手机" }}
        }
    }
}

3.2 范围查询

  • range 查询找出那些落在指定区间内的数字或者时间
GET /siyi/_search
{
    "query":{
        "range": {
            "price": {
                "gte":  1000.0,
                "lt":   2800.00
            }
    	}
    }
}


range查询允许以下字符:

操作符说明
gt大于
gte大于等于
lt小于
lte小于等于

3.3 模糊查询

  • fuzzy 查询是 term 查询的模糊等价。它允许用户搜索词条与实际词条的拼写出现偏差,但是偏差的编辑距离不得超过2:
GET /siyi/_search
{
  "query": {
    "fuzzy": {
      "title": "appla"
    }
  }
}


上面的查询,也能查询到apple手机

我们可以通过fuzziness来指定允许的编辑距离:

GET /siyi/_search
{
  "query": {
    "fuzzy": {
        "title": {
            "value":"appla",
            "fuzziness":1
        }
    }
  }
}

4. 过滤

  • 条件查询中进行过滤

所有的查询都会影响到文档的评分及排名。如果我们需要在查询结果中进行过滤,并且不希望过滤条件影响评分,那么就不要把过滤条件作为查询条件来用。而是使用filter方式:

GET /siyi/_search
{
    "query":{
        "bool":{
        	"must":{ "match": { "title": "小米手机" }},
        	"filter":{
                "range":{"price":{"gt":2000.00,"lt":3800.00}}
        	}
        }
    }
}


注意:filter中还可以再次进行bool组合条件过滤。

  • 无查询条件,直接过滤

如果一次查询只有过滤,没有查询条件,不希望进行评分,我们可以使用constant_score取代只有 filter 语句的 bool 查询。在性能上是完全相同的,但对于提高查询简洁性和清晰度有很大帮助。

GET /siyi/_search
{
    "query":{
        "constant_score":   {
            "filter": {
            	 "range":{"price":{"gt":2000.00,"lt":3000.00}}
            }
        }
    }
}

5. 排序

5.1 单字段排序

  • sort 可以让我们按照不同的字段进行排序,并且通过order指定排序的方式
GET /siyi/_search
{
  "query": {
    "match": {
      "title": "小米手机"
    }
  },
  "sort": [
    {
      "price": {
        "order": "desc"
      }
    }
  ]
}

5.2 多字段排序

  • 假定我们想要结合使用 price和 _score(得分) 进行查询,并且匹配的结果首先按照价格排序,然后按照相关性得分排序:
GET /siyi/goods/_search
{
    "query":{
        "bool":{
        	"must":{ 
        	  "match": { 
        	    "title": "小米手机" 
        	  }
        	}
        }
    },
    "sort": [
      { "price": { "order": "desc" }},
      { "_score": { "order": "desc" }}
    ]
}

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值