7步从零开始搭建一个SOLR支持中文分词【solr3.3】

下载如下三个软件【请注意版本】

1:Solr的下载地址
http://labs.renren.com/apache-mirror//lucene/solr/3.3.0/apache-solr-3.3.0.zip 【使用 D:\solr\apache-solr-3.3.0\example\solr文件夹里的内容】
2:Tomcat的下载地址
http://apache.etoak.com/tomcat/tomcat-6/v6.0.33/bin/apache-tomcat-6.0.33.tar.gz 【使用其运行JAVA WEB】
3:IKAnalyzer下载地址
http://ik-analyzer.googlecode.com/files/IKAnalyzer3.2.8%20bin.zip 【只使用其IKAnalyzer3.2.5Stable.jar】

提前是安装好JDK1.6+,并将每个软件解压到 /sinykk 里


1、将TOMCAT解压到 /usr/local/apache-tomcat-6.0.33/ 

2、将 /solr/apache-solr-3.3.0/example/solr 文件拷贝到 /usr/local/apache-tomcat-6.0.33/

3、然后修改TOMCAT的/usr/local/apache-tomcat-6.0.33/conf/server.xml【增加中文支持】

Xml代码   收藏代码
  1. <Connector port="8983" protocol="HTTP/1.1"   
  2.               connectionTimeout="20000"   
  3.               redirectPort="8443" URIEncoding="UTF-8"/>  

 

 4、添加文件 /usr/local/apache-tomcat-6.0.33/conf/Catalina/localhost/solr.xml 内容如下

 

 

Xml代码   收藏代码
  1. <?xml version="1.0" encoding="UTF-8"?>  
  2. <Context docBase="/usr/local/apache-tomcat-6.0.33/webapps/solr" debug="0" crossContext="true" >  
  3.    <Environment name="solr/home" type="java.lang.String" value="/usr/local/apache-tomcat-6.0.33/solr" override="true" />  
  4. </Context>  
 

5、将/sinykk/solr/apache-solr-3.3.0/example/webapps/solr.war文件放到/usr/local/apache-tomcat-6.0.33/webapps文件夹下,并启动TOMCAT

6、将/sinykk/solr/IKAnalyzer3.2.8.jar 文件放到/usr/local/apache-tomcat-6.0.33/webapps/solr/WEB-INF/lib 目录下


7、修改/usr/local/apache-tomcat-6.0.33/solr/conf/schema.xml文件为

 

Xml代码   收藏代码
  1. <?xml version="1.0" encoding="UTF-8" ?>  
  2. <schema name="example" version="1.4">  
  3.  <types>  
  4.     <fieldType name="string" class="solr.StrField" sortMissingLast="true" omitNorms="true"/>  
  5.      <!--   
  6.     <fieldType name="text_general" class="solr.TextField" positionIncrementGap="100">  
  7.       <analyzer type="index">  
  8.         <tokenizer class="solr.StandardTokenizerFactory"/>  
  9.         <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true" />  
  10.         <filter class="solr.LowerCaseFilterFactory"/>  
  11.       </analyzer>  
  12.       <analyzer type="query">  
  13.         <tokenizer class="solr.StandardTokenizerFactory"/>  
  14.         <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true" />  
  15.         <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>  
  16.         <filter class="solr.LowerCaseFilterFactory"/>  
  17.       </analyzer>  
  18.     </fieldType>  
  19.     -->  
  20.   
  21.      <fieldType name="textik" class="solr.TextField" >  
  22.                <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>    
  23.          
  24.                <analyzer type="index">    
  25.                    <tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory" isMaxWordLength="false"/>    
  26.                    <filter class="solr.StopFilterFactory"    
  27.                            ignoreCase="true" words="stopwords.txt"/>    
  28.                    <filter class="solr.WordDelimiterFilterFactory"    
  29.                            generateWordParts="1"    
  30.                            generateNumberParts="1"    
  31.                            catenateWords="1"    
  32.                            catenateNumbers="1"    
  33.                            catenateAll="0"    
  34.                            splitOnCaseChange="1"/>    
  35.                    <filter class="solr.LowerCaseFilterFactory"/>    
  36.                    <filter class="solr.EnglishPorterFilterFactory"    
  37.                        protected="protwords.txt"/>    
  38.                    <filter class="solr.RemoveDuplicatesTokenFilterFactory"/>    
  39.                </analyzer>    
  40.                 <analyzer type="query">    
  41.                    <tokenizer class="org.wltea.analyzer.solr.IKTokenizerFactory" isMaxWordLength="false"/>    
  42.                    <filter class="solr.StopFilterFactory"    
  43.                            ignoreCase="true" words="stopwords.txt"/>    
  44.                    <filter class="solr.WordDelimiterFilterFactory"    
  45.                            generateWordParts="1"    
  46.                            generateNumberParts="1"    
  47.                            catenateWords="1"    
  48.                            catenateNumbers="1"    
  49.                            catenateAll="0"    
  50.                            splitOnCaseChange="1"/>    
  51.                    <filter class="solr.LowerCaseFilterFactory"/>    
  52.                    <filter class="solr.EnglishPorterFilterFactory"    
  53.                        protected="protwords.txt"/>    
  54.                    <filter class="solr.RemoveDuplicatesTokenFilterFactory"/>    
  55.                </analyzer>    
  56.          
  57. </fieldType>  
  58.  </types>  
  59.   
  60.   
  61.  <fields>  
  62.   <field name="id" type="string" indexed="true" stored="true" required="true" />   
  63.  </fields>  
  64.   
  65.  <uniqueKey>id</uniqueKey>  
  66.   
  67. </schema>  

 

 

最后运行http://192.168.171.129:8983/solr/admin/analysis.jsp

效果图如下

 


 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值