ElasticSearch系列——分词器

最新推荐文章于 2024-09-22 21:14:36 发布

简明编程

最新推荐文章于 2024-09-22 21:14:36 发布

阅读量2.7k

点赞数 2

分类专栏：笔记 # SpringCloud 微服务与中间件文章标签： elasticsearch java 搜索引擎

本文链接：https://blog.csdn.net/qq_51553982/article/details/127756533

版权

分词器

Analysis∶文本分析是把全文本转换一系列单词(term/token)的过程，也叫分词
Analysis是通过Analyzer来实现的。分词就是将文档通过Analyzer分成一个一个的Term,每一个Term都指向包含这个Term的文档。

在ES中默认会使用标准分词器standardAnalyer,其中英语会进行单词分词,中文则是单字分词

character filter ===> tokenizers ===> token filter

character filter(大于等于0) ===> tokenizers(至少有1个) ===> token filter(大于等于0)

其中将standard修改为你要测试的即可

# 分词器
POST /_analyze
{
   
  "analyzer": "standard",
  "text": "你好我是张三 i am very happy"
}

分词器需要在指定映射的时候进行设置

#设置分词器
PUT /analy
{
   
  "mappings": {
   
    "properties": {