solr配置中文分词器

1.配置中文分词器

        1.1如果没有配置好solr的,可以参考 solr整合tomca
          1.2 配置文件介绍: schema.xml,它是Solr数据表配置文件,它定义了加入索引的数据的数据类型的。主要包括FieldTypes、Fields和其他的一些缺省设置。位于solrhome\collection1\conf 如果不知道什么是solrhome,请参考
solr整合tomca
    2.fieldType 域类型定义:   

          2.1.FieldType子结点包括:name,class,positionIncrementGap等一些参数:

          2.2name:是这个FieldType的名称

         2.3.class:是Solr提供的包solr.TextField,solr.TextField 允许用户通过分析器来定制索引和查询,分析器包括一个分词(tokenizer)和多个过滤器(filter)

         2.4 positionIncrementGap:可选属性,定义在同一个文档中此类型数据的空白间隔,避免短语匹配错误,此值相当于Lucene的短语查询设置slop值,根据经验设置为100。

    3.field定义
3.1在field 结点内定义具体的Field,filed定义包括name,type(为之前定义过的各种FieldType),indexed(是否被索引),stored(是否被储存),multiValued(是否存储多个值)等属性。


 4.使用IK中文分词器
4.1 官网下载 IK分词器  ik下载
        4.2 导入jar包到solr项目

      5.拷贝到tomcat中的solr项目web-inf/lib里 



6.找到solrhome文件夹下的schema.xml文件

7.在schema.xml中添加一个自定义的fieldType,使用中文分词器
<fieldtype name="text_ik" stored="false" indexed="true" class="solr.TextField" >
      <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
 </fieldtype>

然后我们在增加一个域,

<field name="title_ik" type="text_ik" indexed="true" stored="true" />

,保存schema,xml文件,重启tomcat


8.测试代码

    打开浏览器访问:http://localhost:8080/solr/



测试结果..........


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值