solr4.10.2 + tomcat6.0.44搭建

最新推荐文章于 2019-02-14 16:39:23 发布

cihongmo6452

最新推荐文章于 2019-02-14 16:39:23 发布

阅读量92

点赞数

文章标签： java

原文链接：https://my.oschina.net/sniperLi/blog/465571

版权

源码：链接：http://pan.baidu.com/s/1qW5KNtM 密码：isa8

搭建完成后目录结构
solr
     home
           solr
                bin
                collection1
                data
                ...
      server
           apache-tomcat-6.0.44
      webapp
           solr
                WEB-INF
                ...

1、将solr-4.10.2\example\webapps\solr.war拷贝到solr\webapp后解压
2、将solr-4.10.2\example\solr拷贝到solr\home目录下
3、将apache-tomcat-6.0.44拷贝到solr\server目录下
4、新建solr/home/solr/data文件夹，修改文件solr\home\solr\collection1\conf\solrconfig.xml
<dataDir>${solr.data.dir:D:\...\solrSpace\solr\home\solr\data}</dataDir>

5、新建apache-tomcat-6.0.44\conf\Catalina\localhost\solr.xml文件5
<?xml version="1.0" encoding="UTF-8"?>
<Context path="/solr" docBase="D:/boke/technology/lucene/solrSpace/solr/webapp/solr" reloadable="false">
<Environment name="solr/home" type="java.lang.String" value="D:/boke/technology/lucene/solrSpace/solr/home/solr" override="true" />
</Context>

6、启动报错，修改tomcat配置，利用log4j输出详细日志信息，见博文：http://my.oschina.net/sniperLi/blog/465298

7、将solr-4.10.4\example\lib\ext下的jar包，全部拷贝到solrSpace\solr\webapp\solr\WEB-INF\lib下。

加入IK分词器：

下载IKAnalyzer2012FF_u1.jar，将IKAnalyzer2012FF_u1.jar拷贝到solrSpace\solr\webapp\solr\WEB-INF\lib，

在schema.xml加入以下配置：

<fieldType name="text_ik" class="solr.TextField">
      <analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
      <analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
    </fieldType>

加入停用词和搜狗词库：

拷贝IKAnalyzer.cfg.xml、stopword.dic、sougou.dic到solrSpace\solr\webapp\solr\WEB-INF\classes目录下，修改IKAnalyzer.cfg.xml，修改如下：

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">
<properties>
<comment>IK Analyzer 扩展配置</comment>
 <entry key="ext_dict">sougou.dic;</entry>


<entry key="ext_stopwords">stopword.dic;</entry>

</properties>

加入mmseg中文分词器  注意，solr4.8版本以上需要mmseg1.9以上才行，solr4.8之后需要1.7的jdk
添加jar包到lib中，solr\webapp\solr\WEB-INF\lib
  technology\lucene\maven\mmseg4j-1.9.1\dist\mmseg4j-analysis-1.9.1.jar、mmseg4j-core-1.9.1.jar、mmseg4j-solr-1.9.1.jar
修改solr\home\solr\collection1\conf\schema.xml文件，加入fieldType
  
  
<fieldType name="textComplex" class="solr.TextField" >
   <analyzer>
            <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="complex" dicPath="dic"/>
        </analyzer>
     </fieldType>
<fieldType name="textMaxWord" class="solr.TextField" >
         <analyzer>
            <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="max-word" dicPath="dic"/>
         </analyzer>
     </fieldType>
<fieldType name="textSimple" class="solr.TextField" >
         <analyzer>
            <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="simple" dicPath="dic"/>
         </analyzer>
     </fieldType>

转载于:https://my.oschina.net/sniperLi/blog/465571

cihongmo6452

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
solr4.10.2 + tomcat6.0.44搭建

源码：链接：http://pan.baidu.com/s/1qW5KNtM 密码：isa8 搭建完成后目录结构solrhomesolrbincollection1...
复制链接

扫一扫