solr 5.0搭建 和使用 ik分词

1.将下载来的solr-5.0.0.zip解压。
创建D:\mysoftsetup\solrserver目录,复制solr-5.0.0\server\solr下所有文件到D:\mysoftsetup\solrserver,
复制Tomcat 到 D:\mysoftsetup\solrserver 目录

[img]http://dl2.iteye.com/upload/attachment/0128/2269/1d5a3490-0da7-3a90-844d-9f32f5cc3978.png[/img]

把solr-5.0.0\server\webapps\solr.war放到tomcat的webapps目录下;启动tomcat自动解压得到solr文件夹。
把solr-5.0.0\server\lib\ext下所有的jar,复制到刚才得到的solr文件夹下的WEB-INF\lib目录下。
把solr-5.0.0\server\resources\log4j.properties复制到webapps\solr\WEB-INF\classes目录下。
修改webapps\solr\WEB-INF\web.xml的:
<env-entry>
<env-entry-name>solr/home</env-entry-name>
<env-entry-value>../../solr</env-entry-value>
<env-entry-type>java.lang.String</env-entry-type>
</env-entry>
指定solr/home为../../solr目录(其实就是:D:\mysoftsetup\solrserver目录中的solr)。

启动tomcat ,访问http://localhost:8393
查看信息:

[img]http://dl2.iteye.com/upload/attachment/0128/2279/9d013801-0ce3-3d01-aa2e-af2e7179cb3c.png[/img]

建立core
把D:\mysoftsetup\solr-5.0.0\example\techproducts\solr\techproducts 复制到D:\mysoftsetup\solrserver\solr 中,techproducts修改为shop_goods,重新启动tomcat


2.使用ik和smartcn 中文分词
复制 solr-5.0.0\contrib\analysis-extras\lucene-libs 下的jar 到Tomcat 中solr/WEB-INF\lib 中,把附件中ik-analyzer-solr5-5.x.jar 也要复制到Tomcat 中solr/WEB-INF\lib 中
3.修改shop_goods中的schema.xml 中添加ik和smartcn 的配置

<fieldType name="text_smart" class="solr.TextField" positionIncrementGap="100">
<analyzer type="index">
<tokenizer class="solr.SmartChineseSentenceTokenizerFactory"/>
<filter class="solr.SmartChineseWordTokenFilterFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="solr.SmartChineseSentenceTokenizerFactory"/>
<filter class="solr.SmartChineseWordTokenFilterFactory"/>
</analyzer>
</fieldType>

<field name="text_smart_ceshi" type="text_smart" indexed="true" stored="true" multiValued="true"/>


<fieldType name="text_ik" class="solr.TextField">
<analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
<analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>

<field name="text_ik_ceshi" type="text_ik" indexed="true" stored="true" multiValued="true"/>


4.重启tomcat测试切词
在左侧选择shop_goods,然后单击“analysis”

[img]http://dl2.iteye.com/upload/attachment/0128/2271/7d1d5d9b-a10a-3c24-8027-76354051158a.png[/img]


测试ik 分词:在Analyse Fieldname / FieldType 中选择“text_ik”,效果如图:

[img]http://dl2.iteye.com/upload/attachment/0128/2273/8d33b867-f4de-355a-bdb5-67bad3c7feb9.png[/img]


测试smark-cn 分词:在Analyse Fieldname / FieldType 中选择“text_smart”,效果如图:

[img]http://dl2.iteye.com/upload/attachment/0128/2275/baf747e0-22ee-30fa-9884-cf7fa51ecba8.png[/img]

shop_goods.rar 为配置好的core
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值