Elasticsearch查询索引文档的6种方法

本文转自https://www.cnblogs.com/shoufeng/p/9952002.html

目录

 

1 Query String Search(查询串检索)

这种方法通过HTTP请求的Query String携带查询参数, 因此得名.

适用于临时性的查询请求, 比如在终端检查基础信息:

# 检索name中包含Java的文档, 并按价格降序排序: 
curl -XGET 'http://localhost:9301/book_shop/it_book/_search?q=name:Java&sort=price:desc' 

生产环境中很少使用, 因为请求参数都封装到Query String中, 难以构建复杂的查询.

(1) 查询全部商品:

直接在浏览器的URL地址栏内输入搜索参数:

http://172.16.22.133:9301/book_shop/it_book/_search?q=name:Java

(2) 查询的结果:

{
    "took": 8,
    "timed_out": false,
    "_shards": {
        "total": 5,
        "successful": 5,
        "skipped": 0,
        "failed": 0
    },
    "hits": {
        "total": 3,
        "max_score": 1,
        "hits": [
            {
                "_index": "book_shop",
                "_type": "it_book",
                "_id": "2",
                "_score": 1,
                "_source": {
                    "name": "深入理解Java虚拟机:JVM高级特性与最佳实践",
                    "author": "周志明",
                    "category": "编程语言",
                    "desc": "Java图书领域公认的经典著作",
                    "price": 79,
                    "date": "2013-10-01",
                    "publisher": "机械工业出版社",
                    "tags": [
                        "Java",
                        "虚拟机",
                        "最佳实践"
                    ]
                }
            },
            // 省略另外两条记录
        ]
    }
}

(3) 查询结果中的各个参数的含义:

① took: 此次检索耗费的时间, 单位是毫秒;

② timed_out: 是否超出规定的检索时间, 这里没有设置, 后续会讲解此参数;

③ _shards: 被查询的index被分散成多个分片, 所以搜索请求会分发到所有的primary shard(或primary shard对应的某个replica shard)上, 这里显示各个分片是否查询成功的信息;

④ hits: 命中的文档情况, 有如下参数:

total: 符合条件的文档总数, 即hit(命中)数;
max_score: Lucene底层对检索到的文档的相关度的评分, 相关度越高, 说明越匹配, score的值也就越高.
hits: 命中的所有document的详细数据.

2 Query DSL(ES特定语法检索)

DSL: Domain Specified Language, 特定领域的语言, 一般需要Kibana等工具配合操作.

这种方式把查询参数构建成JSON格式的数据, 并封装到HTTP请求的Request Body(请求体)中, 可以构建各类复杂的查询语法, 功能要比Query String Search强大很多.

(1) 查询全部商品:

GET book_shop/it_book/_search
{
    "query": { "match_all": {} }
}

(2) 查询name中包含Java的商品, 并按price降序排序:

GET book_shop/it_book/_search
{
    "query": {
        "match": {
            "name": "Java"
        }
    },
    "sort": [
        { "price": "desc" }
    ]
}

(3) 分页查询商品 - 每页显示1条, 显示第3页:

GET book_shop/it_book/_search
{
    "query": { "match_all": {} },
    "from": 2,
    "size": 1
}

(4) 只查询商品的名称和价格:

GET book_shop/it_book/_search
{
    "query": {"match_all": {}},
    "_source": ["name", "price"]
}

—— 上述各类语法可以组合使用, 具体使用方法后续会陆续介绍.

3 Query Filter(过滤检索)

过滤查询, 比如: 查询name中包含Java, 且price不大于80元的商品:

GET book_shop/it_book/_search
{
    "query": {
        "bool": {
          	"must": {
                "match": {"name": "Java"}	// name中含有Java
            },
            "filter": {
                "range": { 
                    "price": {"lte": 80.0}	// 价格不大于80.0
                }
            }
        }
    }
}

4 Full Text Search(全文检索)

(1) 查询描述信息desc中包含"Java图书"的文档, 只显示name和desc的值:

GET book_shop/it_book/_search
{
    "query": {
        "match": {"desc": "Java图书"}
    },
    "_source": ["name", "desc"]
}

(2) 查询结果中有2条数据符合要求:

{
  "took" : 2,
  "timed_out" : false,
  "_shards" : {
    "total" : 5,
    "successful" : 5,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : 2,
    "max_score" : 0.8630463,
    "hits" : [
      {
        "_index" : "book_shop",
        "_type" : "it_book",
        "_id" : "2",
        "_score" : 0.8630463,
        "_source" : {
          "name" : "深入理解Java虚拟机:JVM高级特性与最佳实践",
          "desc" : "Java图书领域公认的经典著作"			// desc中有"Java"和"图书"
        }
      },
      {
        "_index" : "book_shop",
        "_type" : "it_book",
        "_id" : "1",
        "_score" : 0.2876821,
        "_source" : {
          "name" : "Java编程思想(第4版)",
          "desc" : "Java学习必读经典,殿堂级著作!"		// desc中有"Java"
        }
      }
    ]
  }
}

(3) 全文检索的过程 —— 对查询结果的说明:

Elasticsearch会对字段"desc"的内容进行分词, 并建立倒排索引.

也就是说, 这里会把 "Java图书" 分词为 "Java"、"图"、"书" 3个, 检索时将匹配desc中含有 "Java"、"图"、"书" 中任意一个分词的文档.

—— 对于中文分词, 可以通过IK分词器, 把"Java图书"分解为"Java"、"图书" 2个词, 参考博主的文章:ES XX - Elasticsearch中使用IK中文分词器.

5 Phrase Search(短语检索)

Full Text Search会对检索文本作分词处理, 然后从倒排索引中作匹配查询, 如果一个文档的对应field中存在任意一个分解后的词, 那么这个文档就算匹配检索条件.

Phrase Search不会对检索串进行分词处理, 只有一个文档的对应field中包含与检索文本完全一致的内容, 该文档才算匹配检索条件, 也才能作为结果返回 —— 可以理解为全文检索场景下的部分精确匹配.

(1) 精确查询desc中包含"Java图书"的文档:

GET book_shop/it_book/_search
{
    "query": {
        "match_phrase": {
            "desc": "Java图书"
        }
    },
    "_source": ["name", "desc"]
}

(2) 查询结果只有一条数据符合要求了:

{
  "took" : 2,
  "timed_out" : false,
  "_shards" : {
    "total" : 5,
    "successful" : 5,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : 1,
    "max_score" : 0.8630463,
    "hits" : [
      {
        "_index" : "book_shop",
        "_type" : "it_book",
        "_id" : "2",
        "_score" : 0.8630463,
        "_source" : {
          "name" : "深入理解Java虚拟机:JVM高级特性与最佳实践",
          "desc" : "Java图书领域公认的经典著作"		// desc中精确含有"Java图书"
        }
      }
    ]
  }
}

6 Highlight Search(高亮检索)

(1) 分页查询desc中包含"Java图书"的文档, 页大小为1, 显示第1页, 并对搜索条件高亮处理:

GET book_shop/it_book/_search
{
    "query": {
        "match": {"desc": "Java图书"}
    },
    "from": 0,
    "size": 1,
    "highlight": {
        "fields": {"desc": {}}
    },
    "_source": ["name", "desc"]
}

(2) 查询结果:

{
  "took" : 6,
  "timed_out" : false,
  "_shards" : {
    "total" : 5,
    "successful" : 5,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : 2,
    "max_score" : 0.8630463,
    "hits" : [
      {
        "_index" : "book_shop1",
        "_type" : "it_book",
        "_id" : "2",
        "_score" : 0.8630463,
        "_source" : {
          "name" : "深入理解Java虚拟机:JVM高级特性与最佳实践",
          "desc" : "Java图书领域公认的经典著作"
        },
        "highlight" : {		// 高亮显示, 默认添加<em>标签
          "desc" : [
            "<em>Java</em><em>图</em><em>书</em>领域公认的经典著作"
          ]
        }
      }
    ]
  }
}

从上述结果的"<em>Java</em><em>图</em><em>书</em>也可以看出, ES底层对desc字段的值"Java图书"进行了分词处理:

说明: 本文的六种查询方法, 只是一个简单的入门, 详细使用方法会在后续的学习中逐一演示.

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 要实现 Elasticsearch索引联合查询,可以使用 Elasticsearch 的多索引查询功能。具体来说,可以使用 Elasticsearch 的 Multi-Search API 进行多个查询操作,然后将结果合并起来返回给用户。 以下是一个简单的示例代码,假设有两个索引 index1 和 index2,需要联合查询: ``` POST /_msearch {} {"index": "index1"} {"query": {"match_all": {}}} {} {"index": "index2"} {"query": {"match_all": {}}} ``` 上述代码中,`_msearch` 是 Multi-Search API,`index1` 和 `index2` 是要查询的两个索引,`match_all` 是一个简单的查询语句,表示匹配所有文档查询结果会按照查询顺序依次返回,需要自行解析和处理。 需要注意的是,多索引联合查询可能会带来一些性能问题,特别是在大数据量场景下。因此,需要根据实际情况进行权衡和优化。 ### 回答2: Elasticsearch是一个分布式搜索引擎,可以用于存储、搜索和分析大规模的数据集合。在Elasticsearch中,我们可以使用多索引联合查询来实现对多个索引中的数据进行查询和分析。 多索引联合查询Elasticsearch中非常常见和重要。当我们有多个索引,每个索引包含不同类型或字段的数据时,我们可以使用多索引联合查询来同时搜索这些索引,并获取跨多个索引的结果。 使用多索引联合查询的步骤如下: 1. 创建索引:首先,我们需要创建多个索引,并将不同类型或字段的数据分别存储在这些索引中。 2. 查询语句:在进行多索引联合查询之前,我们需要构建一个查询语句。查询语句可以使用Elasticsearch提供的查询DSL(Domain Specific Language)来编写,通过指定不同的索引名称、查询条件和过滤条件来实现。 3. 查询执行:一旦查询语句准备好,我们可以将其发送到Elasticsearch服务器进行查询执行。Elasticsearch会同时搜索多个索引,并返回跨多个索引的结果。 4. 结果处理:最后,我们可以对查询结果进行处理和分析。可以根据需要,对结果进行排序、筛选、聚合等操作。 多索引联合查询在实际的应用场景中非常有用。例如,当我们的数据被分散存储在不同的索引中,需要同时查询和分析这些数据时,我们可以使用多索引联合查询来快速获取所需的结果。 总结而言,Elasticsearch提供了多索引联合查询的功能,可以方便地搜索和分析跨多个索引的数据。通过构建查询语句、执行查询并处理结果,我们可以快速获取我们所需的数据。 ### 回答3: Elasticsearch是一开源的分布式搜索引擎,它可用于实现全文搜索、日志分析、数据可视化和实时数据分析等功能。在Elasticsearch中,可以通过多索引联合查询来同时搜索多个索引并获取结果。 多索引联合查询可以通过以下几方式实现: 1. 使用多个索引名称:可以在查询语句中指定多个索引名称,用逗号分隔。例如,可以使用以下语句同时查询index1和index2两个索引: GET index1,index2/_search { "query": { "match": { "field": "value" } } } 2. 使用通配符查询多个索引:可以使用通配符在查询语句中匹配多个索引名称。例如,可以使用以下语句查询所有以"index"开头的索引: GET index*/_search { "query": { "match": { "field": "value" } } } 3. 使用别名查询多个索引:在创建索引时,可以为索引设置一个别名,然后在查询中使用别名来查询多个索引。例如,可以使用以下语句创建两个索引并为它们设置别名: PUT index1/_alias/myalias PUT index2/_alias/myalias 然后,可以使用以下语句查询myalias别名所对应的索引: GET myalias/_search { "query": { "match": { "field": "value" } } } 多索引联合查询可以帮助我们在一个请求中同时搜索多个索引,提高查询效率和性能。在进行多索引联合查询时,需要注意索引之间的数据结构和映射是否一致,以保证查询结果的准确性和一致性。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值