centos6.4安装solr和IK分词器

1.软件上传

准备好软件

  • solr-4.10.3.tar
  • apache-tomcat-7.0.47.tar.gz

把软件上传到下面的目录

/usr/local/src/

2.软件解压

解压tomcat

tar -zxvf apache-tomcat-7.0.47.tar.gz

重命名tomcat(因为服务器不止安装一个tomcat)

mv apache-tomcat-7.0.47.tar.gz/ apache-solr

端口号自行修改

解压solr-4.10.3.tar

tar -zxvf solr-4.10.3.tar

3.把解压目录下的war包复制到Tomcat的webapps下

进入目录

cd /usr/local/src/solr-4.10.3/example/webapps/

复制solr.war到tomcat的webapps下

cp solr.war /usr/local/src/apache-solr/webapps/

4.解压solr.war包

创建根目录

mkdir solr

将war解压到该目录下

unzip solr.war -d solr

删除war包

rm -rf solr.war

此时启动tomcat显示404

5.复制solr依赖的jar包

进入到第2步解压的solr-4.10.3中

cd /usr/local/src/solr-4.10.3/example/lib/ext

复制所有的jar包到tomcat中

cp * /usr/local/src/apache-solr/webapps/solr/WEB-INF/lib/

此时启动tomcat显示500

6.指定solr home

指定solr服务运行需要加载的索引信息,即solr home。在solr/WEB-INF/web.xml中配置

cd /usr/local/src/apache-solr/webapps/solr/WEB-INF
vim web.xml

取消注释,指定home为第二步解压的solr-4.10.3/example/solr

<env-entry>
    <env-entry-name>solr/home</env-entry-name>
    <env-entry-value>/usr/local/src/solr-4.10.3/example/solr</env-entry-value>
    <env-entry-type>java.lang.String</env-entry-type>
</env-entry>

7.启动测试

127.0.0.1:8080/solr

8.配置IK分词器

(1)软件上传 IKAnalyzer2012FF_hf1.zip
/usr/local/src/
(2)文件解压

该压缩包解压后没有根目录,因此我们在/usr/local/src下创建IK目录

mkdir ik

解压到刚刚创建的ik目录

unzip IKAnalyzer2012FF_hf1.zip -d /usr/local/src/ik/

将IK的jar包copy到tomcat的solr/WEB-INF/lib/目录下

cd /usr/local/src/ik/
cp IKAnalyzer2012FF_u1.jar /usr/local/src/apache-solr/webapps/solr/WEB-INF/lib/
(3)配置自定义分词器

切换到/usr/local/src/solr-4.10.3/example/solr/collection1/conf

cd /usr/local/src/solr-4.10.3/example/solr/collection1/conf

编辑schema.xml

根据对应格式任意位置添加fieldType标签(我是在倒数第二行)

<fieldType name="text_ik" class="solr.TextField">
    <analyzer type="index" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
    <analyzer type="query" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>

测试:使用默认分词器

(7)-->(8)-->(9)
(4)添加停用词

切换到WEB-INF

cd /usr/local/src/apache-solr/webapps/solr/WEB-INF/

创建classes目录

mkdir classes

切换到IK

cd /usr/local/src/ik

将IK的配置文件IKAnalyzer.cfg.xml和停用词典stopword.dic复制到刚刚创建的classes目录下

cp IKAnalyzer.cfg.xml stopword.dic /usr/local/src/apache-solr/webapps/solr/WEB-INF/classes

停用词内容自己编辑

(5)添加扩展词

在classes目录下创建ext.dic文本文件

cd /usr/local/src/apache-solr/webapps/solr/WEB-INF/classes
touch ext.dic

扩展词内容自己编辑

(6)修改IK配置文件
cd /usr/local/src/apache-solr/webapps/solr/WEB-INF/classes/
vim IKAnalyzer.cfg.xml

修改结果:

<properties>
        <comment>IK Analyzer 扩展配置</comment>
        <!--用户可以在这里配置自己的扩展字典 -->
        <entry key="ext_dict">ext.dic;</entry>
        <!--用户可以在这里配置自己的扩展停止词字典-->
        <entry key="ext_stopwords">stopword.dic;</entry>
</properties>
(7)停掉solr服务器
sh /usr/local/src/apache-solr/bin/shutdown.sh 
(8)重新启动solr服务器
sh /usr/local/src/apache-solr/bin/startup.sh
(9)测试
127.0.0.1:8080/solr
Core Sekector--->>collection1--->>Analyseis--->>Field Value (Index)输入词语--->>Analyse Fieldname / FieldType:--->>text_ik--->>Analyse Values
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值