ES 07 - Elasticsearch查询索引文档的6种方法

原文链接:http://www.cnblogs.com/shoufeng/p/9952002.html

目录

1 Query String Search(查询串检索)

这种方法通过HTTP请求的Query String携带查询参数, 因此得名.

适用于临时性的查询请求, 比如在终端检查基础信息:

 
  1. # 检索name中包含Java的文档, 并按价格降序排序:

  2. curl -XGET 'http://localhost:9301/book_shop/it_book/_search?q=name:Java&sort=price:desc'

生产环境中很少使用, 因为请求参数都封装到Query String中, 难以构建复杂的查询.

(1) 查询全部商品:

直接在浏览器的URL地址栏内输入搜索参数:

http://172.16.22.133:9301/book_shop/it_book/_search?q=name:Java

(2) 查询的结果:

 
  1. {

  2. "took": 8,

  3. "timed_out": false,

  4. "_shards": {

  5. "total": 5,

  6. "successful": 5,

  7. "skipped": 0,

  8. "failed": 0

  9. },

  10. "hits": {

  11. "total": 3,

  12. "max_score": 1,

  13. "hits": [

  14. {

  15. "_index": "book_shop",

  16. "_type": "it_book",

  17. "_id": "2",

  18. "_score": 1,

  19. "_source": {

  20. "name": "深入理解Java虚拟机:JVM高级特性与最佳实践",

  21. "author": "周志明",

  22. "category": "编程语言",

  23. "desc": "Java图书领域公认的经典著作",

  24. "price": 79,

  25. "date": "2013-10-01",

  26. "publisher": "机械工业出版社",

  27. "tags": [

  28. "Java",

  29. "虚拟机",

  30. "最佳实践"

  31. ]

  32. }

  33. },

  34. // 省略另外两条记录

  35. ]

  36. }

  37. }

(3) 查询结果中的各个参数的含义:

① took: 此次检索耗费的时间, 单位是毫秒;

② timed_out: 是否超出规定的检索时间, 这里没有设置, 后续会讲解此参数;

③ _shards: 被查询的index被分散成多个分片, 所以搜索请求会分发到所有的primary shard(或primary shard对应的某个replica shard)上, 这里显示各个分片是否查询成功的信息;

④ hits: 命中的文档情况, 有如下参数:

total: 符合条件的文档总数, 即hit(命中)数;
max_score: Lucene底层对检索到的文档的相关度的评分, 相关度越高, 说明越匹配, score的值也就越高.
hits: 命中的所有document的详细数据.

2 Query DSL(ES特定语法检索)

DSL: Domain Specified Language, 特定领域的语言, 一般需要Kibana等工具配合操作.

这种方式把查询参数构建成JSON格式的数据, 并封装到HTTP请求的Request Body(请求体)中, 可以构建各类复杂的查询语法, 功能要比Query String Search强大很多.

(1) 查询全部商品:

 
  1. GET book_shop/it_book/_search

  2. {

  3. "query": { "match_all": {} }

  4. }

(2) 查询name中包含Java的商品, 并按price降序排序:

 
  1. GET book_shop/it_book/_search

  2. {

  3. "query": {

  4. "match": {

  5. "name": "Java"

  6. }

  7. },

  8. "sort": [

  9. { "price": "desc" }

  10. ]

  11. }

(3) 分页查询商品 - 每页显示1条, 显示第3页:

 
  1. GET book_shop/it_book/_search

  2. {

  3. "query": { "match_all": {} },

  4. "from": 2,

  5. "size": 1

  6. }

(4) 只查询商品的名称和价格:

 
  1. GET book_shop/it_book/_search

  2. {

  3. "query": {"match_all": {}},

  4. "_source": ["name", "price"]

  5. }

—— 上述各类语法可以组合使用, 具体使用方法后续会陆续介绍.

3 Query Filter(过滤检索)

过滤查询, 比如: 查询name中包含Java, 且price不大于80元的商品:

 
  1. GET book_shop/it_book/_search

  2. {

  3. "query": {

  4. "bool": {

  5. "must": {

  6. "match": {"name": "Java"} // name中含有Java

  7. },

  8. "filter": {

  9. "range": {

  10. "price": {"lte": 80.0} // 价格不大于80.0

  11. }

  12. }

  13. }

  14. }

  15. }

4 Full Text Search(全文检索)

(1) 查询描述信息desc中包含"Java图书"的文档, 只显示name和desc的值:

 
  1. GET book_shop/it_book/_search

  2. {

  3. "query": {

  4. "match": {"desc": "Java图书"}

  5. },

  6. "_source": ["name", "desc"]

  7. }

(2) 查询结果中有2条数据符合要求:

 
  1. {

  2. "took" : 2,

  3. "timed_out" : false,

  4. "_shards" : {

  5. "total" : 5,

  6. "successful" : 5,

  7. "skipped" : 0,

  8. "failed" : 0

  9. },

  10. "hits" : {

  11. "total" : 2,

  12. "max_score" : 0.8630463,

  13. "hits" : [

  14. {

  15. "_index" : "book_shop",

  16. "_type" : "it_book",

  17. "_id" : "2",

  18. "_score" : 0.8630463,

  19. "_source" : {

  20. "name" : "深入理解Java虚拟机:JVM高级特性与最佳实践",

  21. "desc" : "Java图书领域公认的经典著作" // desc中有"Java"和"图书"

  22. }

  23. },

  24. {

  25. "_index" : "book_shop",

  26. "_type" : "it_book",

  27. "_id" : "1",

  28. "_score" : 0.2876821,

  29. "_source" : {

  30. "name" : "Java编程思想(第4版)",

  31. "desc" : "Java学习必读经典,殿堂级著作!" // desc中有"Java"

  32. }

  33. }

  34. ]

  35. }

  36. }

(3) 全文检索的过程 —— 对查询结果的说明:

Elasticsearch会对字段"desc"的内容进行分词, 并建立倒排索引.

也就是说, 这里会把 "Java图书" 分词为 "Java"、"图"、"书" 3个, 检索时将匹配desc中含有 "Java"、"图"、"书" 中任意一个分词的文档.

—— 对于中文分词, 可以通过IK分词器, 把"Java图书"分解为"Java"、"图书" 2个词, 参考博主的文章:ES XX - Elasticsearch中使用IK中文分词器.

5 Phrase Search(短语检索)

Full Text Search会对检索文本作分词处理, 然后从倒排索引中作匹配查询, 如果一个文档的对应field中存在任意一个分解后的词, 那么这个文档就算匹配检索条件.

Phrase Search不会对检索串进行分词处理, 只有一个文档的对应field中包含与检索文本完全一致的内容, 该文档才算匹配检索条件, 也才能作为结果返回 —— 可以理解为全文检索场景下的部分精确匹配.

(1) 精确查询desc中包含"Java图书"的文档:

 
  1. GET book_shop/it_book/_search

  2. {

  3. "query": {

  4. "match_phrase": {

  5. "desc": "Java图书"

  6. }

  7. },

  8. "_source": ["name", "desc"]

  9. }

(2) 查询结果只有一条数据符合要求了:

 
  1. {

  2. "took" : 2,

  3. "timed_out" : false,

  4. "_shards" : {

  5. "total" : 5,

  6. "successful" : 5,

  7. "skipped" : 0,

  8. "failed" : 0

  9. },

  10. "hits" : {

  11. "total" : 1,

  12. "max_score" : 0.8630463,

  13. "hits" : [

  14. {

  15. "_index" : "book_shop",

  16. "_type" : "it_book",

  17. "_id" : "2",

  18. "_score" : 0.8630463,

  19. "_source" : {

  20. "name" : "深入理解Java虚拟机:JVM高级特性与最佳实践",

  21. "desc" : "Java图书领域公认的经典著作" // desc中精确含有"Java图书"

  22. }

  23. }

  24. ]

  25. }

  26. }

6 Highlight Search(高亮检索)

(1) 分页查询desc中包含"Java图书"的文档, 页大小为1, 显示第1页, 并对搜索条件高亮处理:

 
  1. GET book_shop/it_book/_search

  2. {

  3. "query": {

  4. "match": {"desc": "Java图书"}

  5. },

  6. "from": 0,

  7. "size": 1,

  8. "highlight": {

  9. "fields": {"desc": {}}

  10. },

  11. "_source": ["name", "desc"]

  12. }

(2) 查询结果:

 
  1. {

  2. "took" : 6,

  3. "timed_out" : false,

  4. "_shards" : {

  5. "total" : 5,

  6. "successful" : 5,

  7. "skipped" : 0,

  8. "failed" : 0

  9. },

  10. "hits" : {

  11. "total" : 2,

  12. "max_score" : 0.8630463,

  13. "hits" : [

  14. {

  15. "_index" : "book_shop1",

  16. "_type" : "it_book",

  17. "_id" : "2",

  18. "_score" : 0.8630463,

  19. "_source" : {

  20. "name" : "深入理解Java虚拟机:JVM高级特性与最佳实践",

  21. "desc" : "Java图书领域公认的经典著作"

  22. },

  23. "highlight" : { // 高亮显示, 默认添加<em>标签

  24. "desc" : [

  25. "<em>Java</em><em>图</em><em>书</em>领域公认的经典著作"

  26. ]

  27. }

  28. }

  29. ]

  30. }

  31. }

从上述结果的"<em>Java</em><em>图</em><em>书</em>也可以看出, ES底层对desc字段的值"Java图书"进行了分词处理:

说明: 本文的六种查询方法, 只是一个简单的入门, 详细使用方法会在后续的学习中逐一演示.

版权声明

作者: 马瘦风(https://healchow.com)

出处: 博客园 马瘦风的博客(https://www.cnblogs.com/shoufeng)

感谢阅读, 如果文章有帮助或启发到你, 点个[好文要顶?] 或 [推荐?] 吧?

本文版权归博主所有, 欢迎转载, 但 [必须在文章页面明显位置标明原文链接], 否则博主保留追究相关人员法律责任的权利.

转载于:https://www.cnblogs.com/shoufeng/p/9952002.html

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值