【ElasticSearch】规范化器(Normalizers)详解

目录

概述

自定义规则化器


概述

规范化器类似于分析器,但它们只能生成单个标记。因此,它们没有标记器,并且仅接受可用字符过滤器和标记过滤器的子集。只允许按字符进行操作的过滤器。例如,小写化过滤器是被允许的,但是需要整体查看关键词的词干过滤器则不被允许。目前可用于规范化器的过滤器列表包括:arabic_normalization、asciifolding、bengali_normalization、cjk_width、decimal_digit、elision、german_normalization、hindi_normalization、indic_normalization、lowercase、pattern_replace、persian_normalization、scandinavian_folding、serbian_normalization、sorani_normalization、trim、uppercase。

Elasticsearch附带了一个内置的小写化规范化器。对于其他形式的规范化,需要自定义配置。

自定义规则化器

自定义规范化器接受字符过滤器列表和标记过滤器列表。

PUT index
{
  "settings": {
    "analysis": {
      "char_filter": {
        "quote": {
          "type": "mapping",
          "mappings": [
            "« => \\"",
            "» => \\""
          ]
        }
      },
      "normalizer": {
        "my_normalizer": {
          "type": "custom",
          "char_filter": ["quote"],
          "filter": ["lowercase", "asciifolding"]
        }
      }
    }
  },
  "mappings": {
    "properties": {
      "foo": {
        "type": "keyword",
        "normalizer": "my_normalizer"
      }
    }
  }
}

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值