4,中文分词器
4.1. smartCN(这个是参照别人的安装方法安装的有兴趣可以试一下)
一个简单的中文或中英文混合文本的分词器
这个插件提供 smartcn analyzer 和 smartcn_tokenizer tokenizer,而且不需要配置
# 安装
bin/elasticsearch-plugin install analysis-smartcn
# 卸载
bin/elasticsearch-plugin remove analysis-smartcn

测试一下

可以看到,“今天天气真好”用smartcn分析器的结果是:
[ 今天 , 天气 , 真 , 好 ]
如果用standard分析器的话,结果会是:
[ 今 ,天 ,气 , 真 , 好 ]
4.2 我们一般都会用 IK分词器(我们就具体搭建一下ik中文分词器)
下载对应的版本,这里我下载6

本文介绍了ElasticSearch中的中文分词器,重点讲解了IK分词器的安装步骤和使用方法,包括ik_smart和ik_max_word两种拆分方式,并提供了测试示例。
最低0.47元/天 解锁文章
392

被折叠的 条评论
为什么被折叠?



