- 下载并安装ik分词插件。 ik分词官网: https://github.com/medcl/elasticsearch-analysis-ik
方式一(推荐):
./elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v7.12.0/elasticsearch-analysis-ik-7.12.0.zip
方式二:
a. 在plugins目录下创建目录ik, 并把上述的zip压缩包里的内容解压到ik目录中。
b. 更改ik目录的所有者为ElasticSearch的启动账号
chown -R es ./ik/
c. 修改ik分词器下面的plugin-descriptor.properties文件
vim ./plugin-descriptor.properties
将其中的
elasticsearch.version=7.12.0
改成ElasticSearch的版本, 如
elasticsearch.version=7.12.0
-
重启ElasticSearch
-
IK分词器提供了两种analyzer,分别是ik_max_word和ik_smart
ik_max_word: 会将文本做最细粒度的拆分,比如会将“中华人民共和国国歌”拆分为“中华人民共和国,中华人民,中华,华人,人民共和国,人民,人,民,共和国,共和,国,国歌”,会穷尽各种可能的组合。
ik_smart: 会做最粗粒度的拆分,比如会将“中华人民共和国国歌”拆分为“中华人民共和国,国歌”。
- 测试IK分词器
GET _analyze
{
"text" : "中华人民共和国国歌",
"analyzer": "ik_max_word"
}
GET _analyze
{
"text" : "中华人民共和国国歌",
"analyzer": "ik_smart"
}