ElasticSearch | 结构化搜索

结构化搜索 | Structured Search

  • 结构化搜索是指对结构化数据的搜索;
  • 日期、布尔类型和数字都是结构化的;
  • 文本也可以是结构化的:
    • 彩色笔可以有离散的颜色集合:红、绿、蓝
    • 一个博客可能被标记了标签,例如:分布式、搜索
    • 电商网站上的商品都有 UPCs 或其他的唯一标识,它们都需要遵从严格规定的,结构化的格式;

ElasticSearch 中的结构化搜索

  • 布尔、日期、时间和数字这类结构化的数据,有精确的格式,可以对这些格式进行逻辑操作,包括比较数字和时间的范围,判定两个值的大小;
  • 结构化的文本可以做到精确匹配或者部分匹配
    • Term 查询
    • Prefix 前缀查询
  • 结构化结果只能有“是”和“否”两个值
  • 根据场景需要,可以决定结构化搜索是否需要打分;

结构化搜索 |举几个栗子

准备数据
  • 数据字段的类型有:布尔,时间,long,字符串,这些数据都是结构化的数据;
DELETE products
POST /products/_bulk
{ "index": { "_id": 1 }}
{ "price" : 10,"avaliable":true,"date":"2018-01-01", "productID" : "XHDK-A-1293-#fJ3" }
{ "index": { "_id": 2 }}
{ "price" : 20,"avaliable":true,"date":"2019-01-01", "productID" : "KDKE-B-9947-#kL5" }
{ "index": { "_id": 3 }}
{ "price" : 30,"avaliable":true, "productID" : "JODL-X-1937-#pV7" }
{ "index": { "_id": 4 }}
{ "price" : 30,"avaliable":false, "productID" : "QQPX-R-3956-#aD8" }

GET products/_mapping
对布尔型的值做结构化的搜索
  • 使用 Term 查询就可以;
POST products/_search
{
  "profile": "true",
  "explain": true,
  "query": {
    "term": {
      "avaliable": true
    }
  }
}
布尔型的值做结构化的搜索 | 跳过算分
POST products/_search
{
  "profile": "true",
  "explain": true,
  "query": {
    "constant_score": {
      "filter": {
        "term": {
          "avaliable": true
        }
      }
    }
  }
}
数字类型的 Range 查询
POST products/_search
{
  "query": {
    "constant_score": {
      "filter": {
        "terms": {
          "price": [
            "20",
            "30"
          ]
        }
      }
    }
  }
}
对日期类型进行 Range 查询
  • y - 年
  • M - 月
  • w - w
  • d - 天
  • H / h - 小时
  • m - 分钟
  • s - 秒
POST products/_search
{
    "query" : {
        "constant_score" : {
            "filter" : {
                "range" : {
                    "date" : {
                      "gte" : "now-1y"
                    }
                }
            }
        }
    }
}
通过 Exist 查询找到非空的值
  • 找到有 date 字段的数据;
POST products/_search
{
  "query": {
    "constant_score": {
      "filter": {
        "exists": {
          "field": "date"
        }
      }
    }
  }
}
多值查询 | Term 查询
  • Term 查询是包含而不是等于,会查出字段 genre 中包含 Comedy 的所有数据;
POST /movies/_bulk
{ "index": { "_id": 1 }}
{ "title" : "Father of the Bridge Part II","year":1995, "genre":"Comedy"}
{ "index": { "_id": 2 }}
{ "title" : "Dave","year":1993,"genre":["Comedy","Romance"] }

POST movies/_search
{
  "query": {
    "constant_score": {
      "filter": {
        "term": {
          "genre.keyword": "Comedy"
        }
      }
    }
  }
}
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值