Elasticsearch连续剧之实战搜索文档

一、前言

前几篇文章中,小编给大家介绍了一些es的基本操作,还有常用分词器的搭建,现在给大家来示范一下es的一些常见文档搜索方式。

二、准备工作

在学习文档搜索方式前,我们先来创建一个文档,并添加一些文档数据。

tips: 这里的分词器,我们使用的是上篇文章所说的ik分词器

#创建索引
PUT /students
{
  "mappings":{
    "properties":{
      "id": {
            "type": "integer",
        "index": true
       },
         "name": {
            "type": "text",
            "store": true,
        "index": true,
            "analyzer": "ik_smart"
         },
      "info": {
            "type": "text",
            "store": true,
        "index": true,
            "analyzer": "ik_smart"
         }
     }
   }
}
# 添加数据
POST /students/_doc/
{
 "id":1,
 "name":"小白程序员",
 "info":"I love coding"
}

POST /students/_doc/
{
 "id":2,
 "name":"美羊羊",
 "info":"美羊羊是羊村最漂亮的人"
}

POST /students/_doc/
{
 "id":3,
 "name":"懒羊羊",
 "info":"懒羊羊的成绩不是很好"
}

POST /students/_doc/
{
 "id":4,
 "name":"小灰灰",
 "info":"小灰灰的年纪比较小"
}

POST /students/_doc/
{
 "id":5,
 "name":"沸羊羊",
 "info":"沸羊羊喜欢美羊羊"
}

POST /students/_doc/
{
 "id":6,
 "name":"灰太狼",
 "info":"灰太狼是小灰灰的父亲,每次都会说我一定会回来的"
}

三、文档搜索

1.查询所有文档

match:
1.全文检索字符,将查询条件分词后再进行搜索
2.还支持模糊查询,具有自动纠错功能(最多纠错两个字,超过则报错)

#格式
{
    "query":{
    "match_all":{}
   }
}

eg:  查询全部
GET /students/_search
{
  "query": {
    "match_all": {}
  }
}

2.根据关键词模糊查询

#eg1:全文检索 match:将查询条件分词后再进行搜索 
GET /students/_search
{
  "query": {
    "match": {
      "info": "喜欢"
    }
  }
}
#eg2:match还支持模糊查询 还具有自动纠错功能(最多自动纠错两个字符,超过两个报错)
GET /students/_search
{
  "query": {
    "match": {
      "info": {
        "query": "lov",
        "fuzziness": 1
      }
    }
  }
}

3.范围搜索(range)

对数字类型的字符进行范围搜索,这个和数据库的范围限定符类似。

#格式
{
    "query":{
    "range":{
      搜索字段:{ 
        "gte":最小值,
        "lte":最大值
       } 
     }
   }
}
gt/lt:大于/小于
gte/lte:大于等于/小于等于

eg:
GET /students/_search
{
  "query": {
    "range": {
      "id": {
        "gte": 1,
        "lte": 3
      }
    }
  }
}

4.短语检索

搜索条件不做任何分词解析,在搜索字段对应的倒排索引中精确匹配

#格式
{
    "query":{
    "match_phrase":{
      搜索字段:搜索条件
     }
   }
}

eg:
GET /students/_search
{
  "query": {
    "match_phrase": {
      "info": "成绩"
    }
  }
}

5.词组查询term/terms

单词或者词组搜索,不做任何分词解析,在搜索字段对应的倒排索引中精确匹配

#格式
{
    "query":{
    "term":{ 
            搜索字段: 搜索条件
     }
   }
}


{
    "query":{
    "terms":{ 
            搜索字段: [搜索条件1,搜索条件2]
     }
   }
}

6.复合搜索

es也是可以像Java语言那样,可以将多个条件嵌套使用,从而筛选出符合条件的那一个。

#格式
GET /索引/_search
{ 
    "query": { 
    "bool": { 
      // 必须满足的条件 
      "must": [ 
                搜索方式:搜索参数,
                搜索方式:搜索参数
       ],
      // 多个条件有任意一个满足即可
      "should": [
                搜索方式:搜索参数,
               搜索方式:搜索参数
           ],
            // 必须不满足的条件
           "must_not":[
               搜索方式:搜索参数,
               搜索方式:搜索参数
           ]
       } 
   } 
}
eg:
GET /students/_search
{
  "query": {
    "bool": {
      "must_not": [
        {
          "term": {
            "info": "成绩"
          }
        },
        {
          "range": {
            "id": {
              "gte": 1,
              "lte": 3
            }
          }
        }
      ]
    }
  }
}

上面就是查询出id在1到3范围内,且info里面含有成绩字样的student

7.结果排序

es默认使用相关度分数实现排序,也可以通过搜索语法定制化排序

#格式
GET /索引/_search
{ 
  "query": 搜索条件,
  "sort": [
       {
           "字段1":{
               "order":"asc"
           } 
       },
       { 
           "字段2":{ 
               "order":"desc" 
           } 
       }
   ] 
}
eg:
#1根据匹配度排序,高的在前面
GET /students/_search
{
  "query": {
    "match": {
      "info": "我喜欢成绩好的学生"
    }
  }
}

#2根据搜索语法定制化排序
GET /students/_search
{
  "query": {
    "match": {
      "info": "我喜欢淑仪"
    }
  },
  "sort": [
    {
      "id": {
        "order": "desc"
      }
    }
  ]
}

tips:es默认不会对text类型的字段做排序(因为会分词),如果需要使用text类型的字段做结果排序,可以使用keyword类型的字段作为排序依据(因为keyword类型的字段不会做分词处理)

8.分页查询

这个顾名思义就是当查询内容过多的时候,可以将其分成几页,每页限定规定的数量进行查询。

#格式
GET /索引/_search
{ 
    "query": 搜索条件,
    "from": 起始下标,
    "size": 查询记录数
}
eg:
GET /students/_search
{
	"query":{
        "match_all":{}
    },
    "from":0,
    "size":3
}

9.sql查询

在es里面使用sql语句对文档进行查询(没啥用)

#格式
GET /_sql?format=txt
{
    "query": SQL语句
}
eg:
GET /_sql?format=txt
{
  "query": "select *from students"
}

四、总结

介绍了一些elasticsearch的常见文档搜索方式,结合前几篇文章学习,可以很好地入门es,希望你有所收获。

  • 63
    点赞
  • 56
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 71
    评论
Elasticsearch 是基于开源的 Lucene 搜索引擎构建的高性能分布式搜索和分析引擎。Elasticsearch 支持搜索不同类型的文档,包括文本、数字和地理位置。要搜索文件,需要使用文件解析器来将文件内容转换为 Elasticsearch 可以处理的格式,如 JSON 或 XML。然后,可以使用 Elasticsearch搜索 API 来索引和搜索这些文档。 在 Elasticsearch 中,文档以索引的方式组织存储。索引相当于是一个大型的数据库表,其中包含了所有的文档,每个文档都有一个唯一的 id。要搜索文件,需要首先将文件加载到 Elasticsearch 中的一个索引中。可以使用 Elasticsearch 的 PUT API 构建一个新的索引,并将文件加载到该索引中。要搜索文件,可以使用 Elasticsearch 的 SEARCH API 来搜索索引中的文档搜索 API 提供了各种选项来搜索 Elasticsearch 索引中的文档。可以使用查询字符串、布尔逻辑和聚合等功能来精确控制搜索过程,并获取最优的搜索结果。Elasticsearch 还提供了多种过滤器和聚合功能,用于限制搜索结果的范围和展示数据的方式。 总的来说,搜索文件在 Elasticsearch 中就是将文件解析器加载到 Elasticsearch 索引中,并使用搜索 API 来搜索和过滤文件的内容。通过使用 Elasticsearch搜索和分析功能,可以高效地搜索和管理大量的文件,并实现业务数据的快速检索和分析。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 71
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

狮子也疯狂

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值