elasticsearch 分词器

最新推荐文章于 2024-04-28 06:12:56 发布

gtinlian

最新推荐文章于 2024-04-28 06:12:56 发布

阅读量117

点赞数

分类专栏： log

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/gtinlian/article/details/85242753

版权

log 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

analyzer 分词器

elasticsearch 中自带分词器_analyze

自定义分词器

格式

PUT my_index_word
{
"settings":{
"analysis":{
"char_filter":{}
"tokenizer":{}
"filter":{}
"analyzer":{}
}
}
}

定义分词器实例

PUT myanalyzes
{
"settings": {
"analysis": {
- "analyzer": {
- "mydex":{
- "type":"custom",
- "tokenizer":"mydeftokenizer",
- "char_filter":[
- "mydefchar_filter"
- ],
- "filter":[
- "lowercase",
- "asciifolding"
- ]
- }
- }
  - "tokenizer":{
  - "mydeftokenizer":{
  - "type":"pattern",
  - "pattern":"[.;,/!?]"
  - }
  - },
  - "char_filter":{
  - "mydefchar_filter":{
  - "type":"myapping",
  - "myappings":[
  - ":) => help",
  - "(: => nohelp"
  - ]
  - }
  - }
}
}
}

调用自定义分词器

POST myanalyzes/_analyze
{
"analyzer": "mydex",
"text": ["<p>help' 1 !niad</p>"]
}

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
elasticsearch 分词器

analyzer 分词器 elasticsearch 中自带分词器_analyze Character Filters -针对原始文本进行处理，比如去除html等标记 HTML strip 去除html标签和转换html实体 Mapping 进行字符替换 Pattern Replace 进行正则匹配替换...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。