中文分词器安装配置

最新推荐文章于 2024-06-03 18:25:02 发布

simul00

最新推荐文章于 2024-06-03 18:25:02 发布

阅读量515

点赞数

分类专栏： solr

本文链接：https://blog.csdn.net/erhei0317/article/details/52664185

版权

solr 专栏收录该内容

8 篇文章 0 订阅

订阅专栏

到网上下载ik analyzer包
这里写图片描述 download
解压后得如下目录：

我们先在solr_home（我的solo_home是F:\solr-4.6.0\solr\example\solr）下新建一个lib文件夹，把上述解压后的IKAnalyzer2012FF_u1.jar文件拷贝到刚刚新建的lib文件夹中。然后把IKAnalyzer.cfg.xml和stopword.dic拷贝到F:\solr-4.6.0\solr\example\solr\collection1\conf目录下（也就是跟schema.xml同一个目录下），最后在schema.xml中增加一段配置：

1、将IKAnalyzer-2012-4x.jar或者IKAnalyzer2012FF_u1.jar拷贝到example\solr-webapp\webapp\WEB-INF\lib下；
这里写图片描述
2、然后在example\solr\collection1\conf\schema.xml 中添加fieldType :

<fieldType name="text_ik" class="solr.TextField">   
     <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>   
</fieldType>

如果哪一个字段的类型是“text_ik”，该字段将进行中文分词，比如（如图），title字段就可以进行中文分词，其他的字段不能使用中文分词：
这里写图片描述

启动solr测试java -jar start.jar：
最后测试中文的时候可以选择用text_ik（就是上述配置中fieldType name=”text_ik”定义的）测试；也可以选择 title （上述配置字段 field name="title" type="text_ik"的）测试。效果如下：
这里写图片描述

simul00

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
中文分词器安装配置

到网上下载ik analyzer包 download 解压后得如下目录：我们先在solr_home（我的solo_home是F:\solr-4.6.0\solr\example\solr）下新建一个lib文件夹，把上述解压后的IKAnalyzer2012FF_u1.jar文件拷贝到刚刚新建的lib文件夹中。然后把IKAnalyzer.cfg.xml和stopword.dic拷贝到F:\so
复制链接

扫一扫