ElasticSearch中文分词IK安装

elasticsearch-analysis-ik是一款中文的分词插件,支持自定义词库。

安装步骤:

1、到github网站下载源代码,网站地址为:https://github.com/medcl/elasticsearch-analysis-ik

右侧下方有一个按钮“Download ZIP",点击下载源代码elasticsearch-analysis-ik-master.zip

2、解压文件elasticsearch-analysis-ik-master.zip,进入下载目录,执行命令: unzip elasticsearch-analysis-ik-master.zip  

3、将解压目录文件中config/ik文件夹复制到ES安装目录config文件夹下。

4、因为是源代码,此处需要使用maven打包,进入解压文件夹中,执行命令:mvn clean package  

{

如果提示没有mvn命令

Mvn安装:

sudo wget http://repos.fedorapeople.org/repos/dchen/apache-maven/epel-apache-maven.repo-O /etc/yum.repos.d/epel-apache-maven.repo

(如果wget没安装,执行sudo yum -y install wget)

sudo yum -y install apache-maven

}

5copy and unziptarget/releases/elasticsearch-analysis-ik-{version}.zip toyour-es-root/plugins/ik

6、在ES的配置文件config/elasticsearch.yml中增加ik的配置,在最后增加:


 index:  

 analysis:                     

     analyzer:        

       ik:  

           alias: [ik_analyzer]  

           type: org.elasticsearch.index.analysis.IkAnalyzerProvider  

          ik_max_word:  

             type: ik  

            use_smart: false  

            ik_smart:  

              type: ik  

           use_smart: true  


index.analysis.analyzer.ik.type : “ik”  

7、重新启动elasticsearch服务,这样就完成配置了,收入命令:

curl -XPOST  "http://localhost:9200/userinfo/_analyze?analyzer=ik&pretty=true&text=我是中国人"  

测试结果如下:

	{  
	tokens: [  
	{  
	token: text  
	start_offset: 2  
	end_offset: 6  
	type: ENGLISH  
	position: 1  
	}  
	{  
	token: 我  
	start_offset: 9  
	end_offset: 10  
	type: CN_CHAR  
	position: 2  
	}  
	{  
	token: 中国人  
	start_offset: 11  
	end_offset: 14  
	type: CN_WORD  
	position: 3  
	}  
	{  
	token: 中国  
	start_offset: 11  
	end_offset: 13  
	type: CN_WORD  
	position: 4  
	}  
	{  
	token: 国人  
	start_offset: 12  
	end_offset: 14  
	type: CN_WORD  
	position: 5  
	}  
	]  
	}  





说明:

1ES安装插件本来使用使用命令plugin来完成,但是我本机安装ik时一直不成功,所以就使用源代码打包安装了。

2、自定义词库的方式,请参考 https://github.com/medcl/elasticsearch-analysis-ik

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值