【ElasticSearch查询忽略大小写】

ElasticSearch查询忽略大小写
问题场景:
	在项目中使用ES作为数据存储结构,但是很多时候我们在刚开始创建索引的时候都不知道这个字段是否以后会作为条件对数据进行查询,
	所以创建的时候很多时候都是“text”类型或者是“keyword”类型,这就导致我们在后期想要对该字段作为条件进行大小写不敏感+模糊搜索
	时实现不了我们想要的效果,但是ES在创建完索引后不支持直接对字段类型进行修改,所以只能采取另外一种办法对字段属性进行修改。
1、常用文档类型(数据查询字段)
1.1 text类型:用于全文索引,该类型的字段在数据进行存储的时候会根据当前ES已设置的分词方式进行分词,例如:IK(没有设置的情况
默认采用standard分词)
1.2 keyword类型:该类型的字段在数据进行存储的时候不进行分词,这时候就出现了为什么keyword类型的字段对大小写敏感的问题了,
因为不进行分词,存储的时候是大写就是大写,存储的时候是小写就是小写,不支持存储的时候是大写,但是搜索的时候采用小写对其
进行检索,设置此类型最重要的是如果要对字段进行过滤,排序、聚合等操作时,需要将其设置为keyword类型。
2、问题解决思路
1、查看当前字段是否对索引进行大小写处理
2、新建备份索引,备份原来的索引下的数据
3、将原来的索引下的数据同步到备份索引下
4、删除原来的索引
5、修改原索引属性结构,重建原同名索引
6、将备份索引下的数据同步至新建索引下
7、验证是否成功
8、删除备份索引
2.1 查看当前索引下是否进行分词
GET '索引名称'/_analyze
{
  "field": "title",
  "text": "TEST测试"
}

在Kinaba中执行上述语句,结果如下:

{
  "tokens" : [
    {
      "token" : "test测试",
      "start_offset" : 0,
      "end_offset" : 6,
      "type" : "word",
      "position" : 0
    }
  ]
}

token 就是对应的分词后的结果(此处是我已经设置完了的,所以虽然存储之前是大写TEST,但是经过处理后存储的索引结果是小写test),如果没处理,字段类型是keyword类型,存储索引结果应该也是大写TEST,这时候对其进行小写test进行查询时查询不到该条数据的。

2.2 新建备份索引

2.2.1 查看原索引mapping

GET XXX/_mapping

2.2.2 复制原索引mapping创建备份索引

PUT /XXX
{
	第一步复制的mapping
	"mappings": {
    "XXX": {
      "properties": {
      }
      }
      }
}

2.2.3 将原索引下的数据同步至备份索引下

POST /_reindex
{
  "source": {
    "index": "原索引名称"
  },
  "dest": {
    "index": "备份索引名称"
  }
}

2.2.4 删除原索引,进行重建

1、删除原索引   DELETE 索引名称
2、重建新索引   此处引入“normalizer”属性,此属性的作用就是忽略大小写,只需要加在原索引下想进行忽略大小写进行查询的字段下即可,还需要加入另外对其支撑的setting,如下:
PUT ssb_test_01
{
  "settings": {
    "analysis": {
      "normalizer": {
        "lowercase_normalizer": {
          "type": "custom",
          "char_filter": [],
          "filter": [
            "lowercase"
          ]
        }
      }
    }
  },
  
  "mappings" : {
      "XXX" : {
        "properties" : {
          "allDay" : {
            "type" : "integer"
          },
           "creatorId" : {
            "type" : "keyword"
          },
          "title" : {
            "type" : "keyword",
            "normalizer": "lowercase_normalizer"
          }
         }
        }
       }
      } 

上述代码中,对ssb_test_01索引下的“title”字段进行模糊搜索+忽略大小写查询,所以在其原有keyword属性的基础上加入"normalizer": "lowercase_normalizer"配置,这样就能实现想要的效果。

2.2.5 将备份索引下的数据同步过来,步骤和2.2.3一致,只需要调换索引的位置即可

2.2.6 对新建后的索引进行验证,确认无误后删除备份索引即可


在 “0” 和 “1” 的世界里闭关修炼,才有成为高手的可能,所以请按耐住那颗躁动的心
  • 11
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
在使用Spring集成Elasticsearch7时,可以通过设置索引的映射和查询时使用的分析器来实现忽略大小写的功能。 首先,在创建索引时,可以使用字段的映射设置来指定对应字段的分析器。通过设置分析器为"keyword_lowercase",可以将字段设置为忽略大小写。例如,以下代码片段演示了如何创建一个忽略大小写的索引: ```java CreateIndexRequest createIndexRequest = new CreateIndexRequest("my_index"); createIndexRequest.settings(Settings.builder() .put("index.analysis.analyzer.default.type", "custom") .put("index.analysis.analyzer.default.tokenizer", "keyword") .put("index.analysis.analyzer.default.filter", "lowercase") .build()); Mapping mapping = new Mapping.Builder() .field(new StringField("my_field") .analyzer("keyword_lowercase")) .build(); createIndexRequest.mapping(mapping); CreateIndexResponse response = restHighLevelClient.indices().create(createIndexRequest, RequestOptions.DEFAULT); ``` 在查询时,我们可以使用Spring Data Elasticsearch来构造查询请求。通过使用`QueryBuilders`类提供的`matchQuery`方法,并指定字段为忽略大小写的分析器,可以实现忽略大小写查询。例如,以下代码片段演示了如何使用忽略大小写的方式进行查询: ```java QueryBuilder queryBuilder = QueryBuilders.matchQuery("my_field", "value") .analyzer("keyword_lowercase"); SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder(); searchSourceBuilder.query(queryBuilder); SearchRequest searchRequest = new SearchRequest("my_index"); searchRequest.source(searchSourceBuilder); SearchResponse response = restHighLevelClient.search(searchRequest, RequestOptions.DEFAULT); ``` 通过以上的设置和方法,我们可以在Spring集成Elasticsearch7中实现忽略大小写的功能。这样,无论字段的大小写如何,都可以正确地进行索引和查询操作。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值