Solr之配置中文分词器

最新推荐文章于 2019-11-26 11:46:48 发布

morven936

最新推荐文章于 2019-11-26 11:46:48 发布

阅读量435

点赞数

分类专栏： Spring Ubuntu 文章标签： solr

本文链接：https://blog.csdn.net/haiyanggeng/article/details/80561446

版权

Spring 同时被 2 个专栏收录

13 篇文章 0 订阅

订阅专栏

Ubuntu

6 篇文章 0 订阅

订阅专栏

1、使用solr自带分词器

1.1、拷贝Jar包

cp /opt/solr/solr-7.3.1/contrib/analysis-extras/lucene-libs/lucene-analyzers-smartcn-7.3.1.jar /opt/tomcat/apache-tomcat-8.5.31/webapps/solr/WEB-INF/lib

1.2、修改managed-schema

修改/opt/solr/solrhome/new_core/conf/managed-schema文件,并添加如下内容:

<fieldType name="text_ik_zd" class="solr.TextField" positionIncrementGap="100">
    <analyzer type="index">
      <tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
    </analyzer>
    <analyzer type="query">
      <tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
    </analyzer>
</fieldType>

重启tomcat即可.

2、配置IK中文分词器

下载IK分词器jar包

2.1、拷贝

cp solr-analyzer-ik-5.1.0.jar ik-analyzer-solr5-5.x.jar /opt/tomcat/apache-tomcat-8.5.31/webapps/solr/WEB-INF/lib
cp IKAnalyzer.cfg.xml ext.dic stopword.dic /opt/tomcat/apache-tomcat-8.5.31/webapps/solr/WEB-INF/classes

2.2、修改managed-schema

修改/opt/solr/solrhome/new_core/conf/managed-schema文件,并添加如下内容:

<fieldType name="text_ik" class="solr.TextField">
    <analyzer type="index">
      <tokenizer class="org.apache.lucene.analysis.ik.IKTokenizerFactory" useSmart="true"/>
    </analyzer>
    <analyzer type="query">
      <tokenizer class="org.apache.lucene.analysis.ik.IKTokenizerFactory" useSmart="true"/>
    </analyzer>
</fieldType>

morven936

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Solr之配置中文分词器

1、使用solr自带分词器1.1、拷贝Jar包cp /opt/solr/solr-7.3.1/contrib/analysis-extras/lucene-libs/lucene-analyzers-smartcn-7.3.1.jar /opt/tomcat/apache-tomcat-8.5.31/webapps/solr/WEB-INF/lib1.2、修改managed-sch...
复制链接

扫一扫