elasticsearch 中文分词(elasticsearch-analysis-ik)


elasticsearch 中文分词(elasticsearch-analysis-ik)

 

******************************

默认中文分词:将中文分割成单独的字

 

示例

         

 

         

 

 

******************************

elasticsearch-analysis-ik

 

官网地址:elasticsearch-analysis-ik

 

**********************

安装elasticsearch-analysis-ik

 

创建容器

docker run -it --net fixed --ip 172.18.0.33 -p 9201:9200 -p 9301:9300  \
-e ES_JAVA_OPTS="-Xms512m -Xmx512m"  \
-v /usr/elasticsearch/single/conf/elasticsearch.yml:/usr/share/elasticsearch/config/elasticsearch.yml \
--name es-single2 elasticsearch:7.5.1

 

进入容器安装elasticsearch-analysis-ik,重启后生效

./bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v7.5.1/elasticsearch-analysis-ik-7.5.1.zip

 

elasticsearch-plugin相关命令

            

 

查看安装的插件

           

 

**********************

测试 analysis-ik

 

ik_max_word:将文本做最细粒度的拆分,适合term query

           

           

 

ik_smart:会将文本做最粗粒度的拆分,适合phrase query,常使用该分词方式

          

          

 

 

**********************

添加本地词库:词库修改后需重启生效

 

词典配置文件位置:/usr/share/elasticsearch/config/analysis-ik/IKAnalyzer.cfg.xml

 

在目录:/usr/share/elasticsearch/config/analysis-ik新增hot.dic

厉害了
厉害了我的国
厉害了,我的国

 

修改配置文件后,重启elasticsearch

         

 

测试分词

        

 

        

 

 

**********************

添加远程词库:词库修改后只要重启远程应用,elasticsearch不需要重启就会自动加载最新词库

 

未添加远程词库分词测试

         

 

******************

添加远程词库相关操作

 

创建应用,使用docker创建容器

               

 

配置文件添加远程词库

         

 

*********************

测试远程词库分词

 

撒浪嘿

          

 

*****************

动态添加远程词库,之后重启远程应用:撒浪嘿撒浪嘿

 

未添加前

          

 

添加后,重启远程应用

          

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值