elasticsearch分词时按照逗号分词

在做项目的时候 对类似于 这种标签进行分词处理的时候

建筑,摄影,机械,IT,旅游

ik分词器会自动将IT过滤,导致查询IT的时候无法查询相关文档

如何解决,重新定义分词规则,可以按照逗号 “,”来分词 将词分为

建筑
摄影
机械
IT
旅游

效果如下

GET shenbioffice_1/doc/174629/_termvectors?fields=goods_tag
这里写图片描述
实现方式:创建索引的时候重新定义分词规则

"settings": {
  "index": {
    "number_of_shards": "1",
    "number_of_replicas": "1"
  },
  "analysis": {
        "analyzer": {
            "comma": {
                 "type": "pattern",
                 "pattern":","
                }
            }
        }
    }

在需要分词的字段加入如下设置

      "goods_tag": {
        "type": "text",
        "analyzer": "comma",
        "search_analyzer": "comma"
      },

就可以实现插入时按照逗号分词

  • 2
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值