solr5.5+中文分词

最新推荐文章于 2021-09-30 17:38:42 发布

weixin_30604651

最新推荐文章于 2021-09-30 17:38:42 发布

阅读量53

点赞数

原文链接：http://www.cnblogs.com/sunjter/p/5456681.html

版权

solr5.5+中文分词

首先，solr5.5自带的中文分词实在是太low了。

无奈。

采用ik来试试。

首先，下载ik。地址https://github.com/EugenePig/ik-analyzer-solr5

下载完成后解压

在解压目录打开命令行窗口：mvn clean install

等着完成就可以了。

至此，打包完成。

编译结果如下：

拷贝ik-analyzer-solr5-5.x.jar 到solr5.5目录（F:\work1\tools\tomcat-8.0.32\webapps\solr\WEB-INF\lib）

下一步就是配置了：

如果你的core目录中没有schema.xml ,那么修改managed-schema文件是一样的，添加以下配置：

<fieldType name="text_ik" class="solr.TextField">
        <analyzer type="index" useSmart="false"
            class="org.wltea.analyzer.lucene.IKAnalyzer" />
        <analyzer type="query" useSmart="true"
            class="org.wltea.analyzer.lucene.IKAnalyzer" />
</fieldType>

然后重新启动solr5.5

测试：

结束。

另：关于ik的智能分词

配置須采用如下设置：

<fieldType name="text_ik" class="solr.TextField">   
    <analyzer type="index">
      <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" />
    </analyzer>
    <analyzer type="query">
      <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="true" />
    </analyzer>
  </fieldType>

之前的设置无法实现智能分词，及useSmart设置无效。

posted on 2016-05-03 21:56 海水中的泪阅读( ...) 评论( ...) 编辑收藏

转载于:https://www.cnblogs.com/sunjter/p/5456681.html

weixin_30604651

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
solr5.5+中文分词

solr5.5+中文分词首先，solr5.5自带的中文分词实在是太low了。无奈。采用ik来试试。首先，下载ik。地址https://github.com/EugenePig/ik-analyzer-solr5下载完成后解压在解压目录打开命令行窗口：mvn clean install等着完成就可以了。...
复制链接

扫一扫