Elasticserach 中文分词插件

本文介绍了三个Elasticsearch的中文分词插件:elasticsearch-analysis-hanlp,它提供准确的中文分词和远程词典支持;elasticsearch-analysis-ik,这是一个常用的分词插件,支持词典热更新;以及elasticsearch-analysis-pinyin,用于将中文分词转换为拼音,适合拼音搜索场景。每个插件都包含其定义、特性、官网链接及安装说明。
摘要由CSDN通过智能技术生成

一、elasticsearch-analysis-hanlp

1)定义:面向生产环境的自然语言处理工具包,中文分词器。
2)github官网:https://github.com/KennFalcon/elasticsearch-analysis-hanlp
3)特性:中文分词比较准确、可以远程设置词典、可以自定义词典
4)官网有安装、版本说明
5)演示,该分词插件有多种模式

#ik_max_word
#ik_smart
#hanlp: hanlp默认分词
#hanlp_standard: 标准分词
#hanlp_index: 索引分词
#hanlp_nlp: NLP分词
#hanlp_n_short: N-最短路分词
#hanlp_dijkstra: 最短路分词
#hanlp_crf: CRF分词(在hanlp 1.6.6已开始废弃)
#hanlp_speed: 极速词典分词

POST _analyze
{
   
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值