一、elasticsearch-analysis-hanlp
1)定义:面向生产环境的自然语言处理工具包,中文分词器。
2)github官网:https://github.com/KennFalcon/elasticsearch-analysis-hanlp
3)特性:中文分词比较准确、可以远程设置词典、可以自定义词典
4)官网有安装、版本说明
5)演示,该分词插件有多种模式
#ik_max_word
#ik_smart
#hanlp: hanlp默认分词
#hanlp_standard: 标准分词
#hanlp_index: 索引分词
#hanlp_nlp: NLP分词
#hanlp_n_short: N-最短路分词
#hanlp_dijkstra: 最短路分词
#hanlp_crf: CRF分词(在hanlp 1.6.6已开始废弃)
#hanlp_speed: 极速词典分词
POST _analyze
{