1、下载
必须找到和es版本相对应的版本
2、解压
(如果已安装mvn工具, 则可以直接解压到 es目录 plugins下新建ik文件夹,解压至此即可。)
3、用maven工具编译
如果没有maven工具,则需要安装mvn工具。然后,进行编译和打包。
详见
4、启动
启动es ,看到如下信息,则ik启动成功。
5、验证ik分词器
GET _analyze
{
"analyzer": "ik_max_word"
, "text": "中华人民共和国万岁"
}
GET _analyze
{
"analyzer": "ik_smart"
, "text": "中华人民共和国万岁"
}
GET _analyze
{
"analyzer": "standard"
, "text": "中华人民共和国万岁"
}
ik_max_word 和 ik_smart 什么区别?
ik_max_word: 会将文本做最细粒度的拆分,比如会将"中华人民共和国国歌"拆分为"中华人民共和国,中华人民,中华,华人,人民共和国,人民,人,民,共和国,共和,和,国国,国歌",会穷尽各种可能的组合,适合 Term Query;
ik_smart: 会做最粗粒度的拆分,比如会将"中华人民共和国国歌"拆分为"中华人民共和国,国歌",适合 Phrase 查询。
常见的还有很多中文分词器,很多大学的实验室也在做相应的内容。
6、同理,拼音分词,请自行解决。、