在进行分词时es有时没有办法对人名或者其他新词、偏词进行精准的分词,这时候就需要我们进行自定义分词。
前置:
1).安装完成ik分词器,安装流程可以参考:ik安装流程
2).自定义的远程库我们使用nginx,所以需要提前安装nginx
1.进入到ngin的/nginx/html/目录下创建es文件夹,创建命令
mkdir es
2.进入到es目录下创建一个txt文件并完成自定义词库
打开fenci.txt,进行编辑自定义分词
我们创建一个“是中”的词,保存并退出
3.调整ik配置文件(进行了外部挂在文件,如果没有进行挂在可以进入容器内部操作)
4.修改远程扩展字典表的指向地址,指向我们的nginx下创建的es/fenci.txt
保存完成后,重新启动es容器
5.测试验证结果
添加自定义分词前:
添加后:
我们可以看到已经生效