solr4.10配置中文分词器IKAnalyzer

中文分词器下载

  1. 将下载的压缩包解压并上传至服务器
  2. 把dist目录的分此前jar包添加到solr工程classpath的lib中。位置:/usr/local/solr/tomcat/webapps/solr/WEB-INF/lib

  3. 把src目录中IKAnalyzer需要的扩展词典及停用词词典、配置文件复制到solr工程classpath的classes中。需要新建文件夹classes目录。

  4. 扩展词典及停用词词典的字符集必须是无bom编码的utf-8格式,不能使用记事本编辑。
  5. 配置fieldType。在solrhome/collection1/conf/schema.xml中追加如下代码。

    <fieldType name="text_ik" class="solr.TextField">

      <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>

    </fieldType>

  6. 配置业务字段field。在solrhome/collection1/conf/schema.xml中追加如下代码。

    <field  name="item_title"  type="text_ik"  indexed="true"  stored="true"/>

    <field  name="item_sell_point"  type="text_ik"  indexed="true"  stored="true"/>

    <field  name="item_price"  type="long"  indexed="true"  stored="true"/>

    <field  name="item_image"  type="string"  indexed="false"  stored="true" />

    <field  name="item_category_name"  type="string"  indexed="true"  stored="true" />

    <field  name="item_desc"  type="text_ik"  indexed="true"  stored="false" />

     

    <field name="item_keywords" type="text_ik" indexed="true" stored="false" multiValued="true"/>

    <copyField  source="item_title"  dest="item_keywords"/>

    <copyField  source="item_sell_point"  dest="item_keywords"/>

    <copyField  source="item_category_name"  dest="item_keywords"/>

    <copyField  source="item_desc"  dest="item_keywords"/>

    stored:查询出来的结果是否要在页面上显示

    indexed:表示是否是检索字段,用于查询

    multiValued="true",表明当前字段会使用下面的copyField标签中的字段来匹配。

  7. 启动tomcat,访问虚拟机IP地址/solr,进入可视化管理界面的Analysis,测试新建的分词字段。
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值