Elasticsearch连续剧之实战搜索文档

狮子也疯狂

已于 2023-04-18 11:36:14 修改

阅读量9.5k

点赞数 63

分类专栏：中间件核心组件精讲文章标签： elasticsearch 全文检索大数据

于 2023-01-23 13:23:19 首次发布

本文链接：https://blog.csdn.net/m0_58847451/article/details/128752276

版权

中间件核心组件精讲专栏收录该内容

17 篇文章 12 订阅

订阅专栏

一、前言

前几篇文章中，小编给大家介绍了一些es的基本操作，还有常用分词器的搭建，现在给大家来示范一下es的一些常见文档搜索方式。

二、准备工作

在学习文档搜索方式前，我们先来创建一个文档，并添加一些文档数据。

tips: 这里的分词器，我们使用的是上篇文章所说的ik分词器

#创建索引
PUT /students
{
  "mappings":{
    "properties":{
      "id": {
            "type": "integer",
        "index": true
       },
         "name": {
            "type": "text",
            "store": true,
        "index": true,
            "analyzer": "ik_smart"
         },
      "info": {
            "type": "text",
            "store": true,
        "index": true,
            "analyzer": "ik_smart"
         }
     }
   }
}
# 添加数据
POST /students/_doc/
{
 "id":1,
 "name":"小白程序员",
 "info":"I love coding"
}

POST /students/_doc/
{
 "id":2,
 "name":"美羊羊",
 "info":"美羊羊是羊村最漂亮的人"
}

POST /students/_doc/
{
 "id":3,
 "name":"懒羊羊",
 "info":"懒羊羊的成绩不是很好"
}

POST /students/_doc/
{
 "id":4,
 "name":"小灰灰",
 "info":"小灰灰的年纪比较小"
}

POST /students/_doc/
{
 "id":5,
 "name":"沸羊羊",
 "info":"沸羊羊喜欢美羊羊"
}

POST /students/_doc/
{
 "id":6,
 "name":"灰太狼",
 "info":"灰太狼是小灰灰的父亲，每次都会说我一定会回来的"
}

三、文档搜索

1.查询所有文档

match：
1.全文检索字符，将查询条件分词后再进行搜索
2.还支持模糊查询，具有自动纠错功能（最多纠错两个字，超过则报错）

#格式
{
    "query":{
    "match_all":{}
   }
}

eg:  查询全部
GET /students/_search
{
  "query": {
    "match_all": {}
  }
}

2.根据关键词模糊查询

#eg1：全文检索 match：将查询条件分词后再进行搜索 
GET /students/_search
{
  "query": {
    "match": {
      "info": "喜欢"
    }
  }
}
#eg2：match还支持模糊查询 还具有自动纠错功能(最多自动纠错两个字符，超过两个报错)
GET /students/_search
{
  "query": {
    "match": {
      "info": {
        "query": "lov",
        "fuzziness": 1
      }
    }
  }
}

3.范围搜索（range）

对数字类型的字符进行范围搜索,这个和数据库的范围限定符类似。

#格式
{
    "query":{
    "range":{
      搜索字段:{ 
        "gte":最小值,
        "lte":最大值
       } 
     }
   }
}
gt/lt:大于/小于
gte/lte:大于等于/小于等于

eg：
GET /students/_search
{
  "query": {
    "range": {
      "id": {
        "gte": 1,
        "lte": 3
      }
    }
  }
}

4.短语检索

搜索条件不做任何分词解析，在搜索字段对应的倒排索引中精确匹配

#格式
{
    "query":{
    "match_phrase":{
      搜索字段:搜索条件
     }
   }
}

eg：
GET /students/_search
{
  "query": {
    "match_phrase": {
      "info": "成绩"
    }
  }
}

5.词组查询term/terms

单词或者词组搜索，不做任何分词解析，在搜索字段对应的倒排索引中精确匹配

#格式
{
    "query":{
    "term":{ 
            搜索字段: 搜索条件
     }
   }
}


{
    "query":{
    "terms":{ 
            搜索字段: [搜索条件1,搜索条件2]
     }
   }
}

6.复合搜索

es也是可以像Java语言那样，可以将多个条件嵌套使用，从而筛选出符合条件的那一个。

#格式
GET /索引/_search
{ 
    "query": { 
    "bool": { 
      // 必须满足的条件 
      "must": [ 
                搜索方式:搜索参数,
                搜索方式:搜索参数
       ],
      // 多个条件有任意一个满足即可
      "should": [
                搜索方式:搜索参数,
               搜索方式:搜索参数
           ],
            // 必须不满足的条件
           "must_not":[
               搜索方式:搜索参数,
               搜索方式:搜索参数
           ]
       } 
   } 
}
eg:
GET /students/_search
{
  "query": {
    "bool": {
      "must_not": [
        {
          "term": {
            "info": "成绩"
          }
        },
        {
          "range": {
            "id": {
              "gte": 1,
              "lte": 3
            }
          }
        }
      ]
    }
  }
}

上面就是查询出id在1到3范围内，且info里面含有成绩字样的student

7.结果排序

es默认使用相关度分数实现排序，也可以通过搜索语法定制化排序

#格式
GET /索引/_search
{ 
  "query": 搜索条件,
  "sort": [
       {
           "字段1":{
               "order":"asc"
           } 
       },
       { 
           "字段2":{ 
               "order":"desc" 
           } 
       }
   ] 
}
eg:
#1根据匹配度排序，高的在前面
GET /students/_search
{
  "query": {
    "match": {
      "info": "我喜欢成绩好的学生"
    }
  }
}

#2根据搜索语法定制化排序
GET /students/_search
{
  "query": {
    "match": {
      "info": "我喜欢淑仪"
    }
  },
  "sort": [
    {
      "id": {
        "order": "desc"
      }
    }
  ]
}

tips：es默认不会对text类型的字段做排序（因为会分词），如果需要使用text类型的字段做结果排序，可以使用keyword类型的字段作为排序依据（因为keyword类型的字段不会做分词处理）

8.分页查询

这个顾名思义就是当查询内容过多的时候，可以将其分成几页，每页限定规定的数量进行查询。

#格式
GET /索引/_search
{ 
    "query": 搜索条件,
    "from": 起始下标,
    "size": 查询记录数
}
eg：
GET /students/_search
{
	"query":{
        "match_all":{}
    },
    "from":0,
    "size":3
}

9.sql查询

在es里面使用sql语句对文档进行查询（没啥用）

#格式
GET /_sql?format=txt
{
    "query": SQL语句
}
eg:
GET /_sql?format=txt
{
  "query": "select *from students"
}

四、总结

介绍了一些elasticsearch的常见文档搜索方式，结合前几篇文章学习，可以很好地入门es，希望你有所收获。

狮子也疯狂

关注

63
点赞
踩
56

收藏

觉得还不错? 一键收藏
打赏
71
评论
Elasticsearch连续剧之实战搜索文档

前几篇文章中，小编给大家介绍了一些es的基本操作，还有常用分词器的搭建，现在给大家来示范一下es的一些常见文档搜索方式。介绍了一些elasticsearch的常见文档搜索方式，结合前几篇文章学习，可以很好地入门es，希望你有所收获。
复制链接

扫一扫