es在索引中自定义简单的分词器 Analyzer 扩展

es在索引中自定义简单的分词器 Analyzer 扩展


PUT index1
{
  "settings": {
    "analysis": {
      "analyzer": {
        "ik_max_word_expand": {
          "type": "custom",
          "char_filter": "html_strip",
          "tokenizer": "ik_max_word"
        }
      }
    }
  }
}

 

在索引中自定义简单的分词器 Analyzer

上面各个步骤介绍了Analyzer的构成,以及ElasticSearch为每一部分所提供的默认实现,通过组合这些默认实现,我们可以构建属于自己的 Analyzer。

自定义的 Analyzer 必须关联到一个索引上,其语法格式如下:

PUT 索引名称

{

"settings": {

    "analysis": {
 

      "analyzer": {
 

        "自定义分词器名称":{
 

              自定义分词器具体内部实现
 

        }
 

      }
 

    }
 

  }
}

通过组合 html strip (character filter), ik_max_word(tokernizer)来实现自己的分词器

GET index1


POST /index1/_analyze
{
  "analyzer": "ik_max_word_expand",
  "text": "我们是中国人<html>2</html>

}

 

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值