solr4.10.3配置中文分词器

最新推荐文章于 2020-12-22 17:22:09 发布

qingxinYU

最新推荐文章于 2020-12-22 17:22:09 发布

阅读量646

点赞数

分类专栏： solr

本文链接：https://blog.csdn.net/qingxinYU/article/details/80406593

版权

solr 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

一、下载

二、上传

上传中文分词器jar包 IKAnalyzer2012FF_u1.jar

三、把IKAnalyzer2012FF_u1.jar添加到solr/WEB-INF/lib目录下

[root@itcast-01 example]# cd/usr/local/solr/tomcat/webapps/solr/WEB-INF/lib/

[root@itcast-01 lib]# mv/root/IKAnalyzer2012FF_u1.jar ./

四、复制IKAnalyzer的配置文件和自定义词典和停用词词典到Tomcat服务

[root@itcast-01 lib]# cd ../classes

[root@itcast-01 classes]# mv /root/ext.dic./

[root@itcast-01 classes]# mv/root/IKAnalyzer.cfg.xml ./

[root@itcast-01 classes]#mv /root/stopword.dic ./

五、在schema.xml配置中文分词器

根据业务需要选择相应的字段对应solr的字段，本项目涉及的数据库表如下：

根据表配置业务域--fieldname

[root@itcast-01 WEB-INF]# cd/usr/local/solr/solrhome/collection1/conf/

[root@itcast-01 conf]# vim schema.xml

另外，解释一下IK的配置，其中IKAnalyzer.cfg.xml为配置文件，主要用来配置扩展词库，禁止词词库等

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">  
<properties>  
    <comment>IK Analyzer 扩展配置</comment>
    <!--用户可以在这里配置自己的扩展字典 -->
    <entry key="ext_dict">ext.dic;</entry> 
    <!--用户可以在这里配置自己的扩展停止词字典-->
    <entry key="ext_stopwords">stopword.dic;</entry> 
</properties>