ES内置分词器简介
分词器 | 简介 |
---|---|
Standard Analyzer | 默认分词器,按此切分,小写处理 |
Simple Analyzer | 按照非字母切分,小写处理 |
Stop Analyzer | 停用词过滤,小写处理 |
Whitespace Analyzer | 按照空格切分,不转小写 |
Keyword Analyzer | 不分词,直接输出 |
Patter Analyzer | 正则表达式 |
这些内置的分词器对中文极不友好,因此我们需要安装专门用于中文分词的ik分词器
IK分词器的安装
点击蓝色字体进入界面
选择Terminal进入终端
cd /usr/share/elasticsearch/bin
./elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v7.14.2/elasticsearch-analysis-ik-7.14.2.zip
输入以下命令,注意要修改ik分词器版本与你的es版本一致
elasticsearch-plugin list
输入命令后出现下图所示表示安装成功。
IK分词器的使用
名称 | 作用 |
---|---|
ik_smart | 粗粒度分词,每个词只会出现一次 |
ik_max_word | 细粒度分词,每个词出现多次 |
ik_max_word
ik_smart