ik分词器
采用了特有的“正向迭代最细粒度切分算法“,具有80万字/秒的高速处理能力 采用了多子处理器分析模式,支持:英文字母(IP地址、Email、URL)、数字(日期,常用中文数量词,罗马数字,科学计数法),中文词汇(姓名、地名处理)等分词处理。 优化的词典存储,更小的内存占用。
IK分词器 Elasticsearch插件地址:https://github.com/medcl/elasticsearch-analysis-ik
#安装方法:
下载并解压到 elasticsearch-6.4.2/plugins目录下
elasticsearch-analysis-ik-6.5.4.zip
#解压
unzip elasticsearch-analysis-ik-6.5.4.zip
#重启
./bin/elasticsearch
测试:
请参考https://github.com/medcl/elasticsearch-analysis-ik/tree/v6.4.2 完成安装测试
pingyin分词器
下载https://github.com/medcl/elasticsearch-analysis-pinyin 6.4.2
重新启动es,使用index发现插件里面新增了pinyin分词器
测试