《十次方》项目小札-3-IK分词器

1.简介

在浏览器输入
http://127.0.0.1:9200/_analyze?analyzer=chinese&pretty=true&text=我是程序员,效果如下

在这里插入图片描述

2.使用

将ik分词器下载解压至es目录下的 plugins 目录下,然后重启es服务。
测试下效果:重新访问

2.1.最小切分:

http://127.0.0.1:9200/_analyze?analyzer=ik_smart&pretty=true&text=我是程序员,对比下效果。
在这里插入图片描述

2.2.最细切分:

http://127.0.0.1:9200/_analyze?analyzer=ik_max_word&pretty=true&text=我是程序员。
效果:
在这里插入图片描述

2.3.自定义词库

目的:让分词器识别特定的词组。
step:
(1)进入elasticsearch/plugins/ik/config目录
(2)新建一个custom.dic文件(注意乱码-选utf8,直接cv已有的文件改名最方便),编辑内容:“今辞拂衣”
修改 IKAnalyzer.cfg.xml(在ik/config目录下)

<properties>
	<comment>IK Analyzer 扩展配置</comment>
	<!‐‐用户可以在这里配置自己的扩展字典 ‐‐>
	<entry key="ext_dict">custom.dic</entry>
	<!‐‐用户可以在这里配置自己的扩展停止词字典‐‐>
	<entry key="ext_stopwords"></entry>
</properties>

重新启动elasticsearch,通过浏览器测试分词效果。
在这里插入图片描述

3.docker安装运行ik分词器

将ik复制到docker中es的plugin目录下
参考博文:https://www.cnblogs.com/ya-qiang/p/9754983.html
使用secureCRT将win文件上传到linux下。
1.ALT+P进入传输界面。
2.

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值