目录
一定要注意,集群中操作节点要一台一台操作,不要全部重启,以免影响使用。
本篇文章主要介绍ES的分词器,ES自带standard analyzer、simple analyzer、whitespace analyzer、stop analyzer、language analyzer、pattern analyzer等6种分词器。首先我们来测试一下这5种分词器是否满足我们的业务需要。以下测试我主要通过测试中文的分析能力。
一、内置分词器测试
1.standard analyzer
说明:
标准分析器是默认分词器,如果未指定,则使⽤该分词器,该分词器主要是为英文设计的,英文分词很简单,单词之间都是有空格或标点符号的,不像中文,中文的词与词之间很有可能是连贯的很难区分,所以标准分词器并不适用于中文分词。
请求:
POST 127.0.0.1:9200/blog/_analyze
{
"analyzer": "standard",
"text": "我是中国人"
}
结果: