Solr-5.5.0 Chinese Word Plugins

1.Solr自带分词器对中文支持不好

1.1 默认分词器

字段类型: text_ja

字段类型:text_general

 

小结:

         Solr自带的分词器对中文分词效果不理想,要么不分词,要么所有汉字都被分隔开来。所以需要增加理想的中文分词插件。

2. mmseg4j分词器

2.1 下载

https://github.com/chenlb/mmseg4j-solr/wiki下载

2.2 拷贝jar包

拷贝到SolrCloud所有节点(node1,node2,node3)的/usr/local/src/solr-5.5.0/server/solr-webapp/webapp/WEB-INF/lib目录下。

2.2 编辑node1的配置文件schema.xml

 

 

3. IK Analyzer分词器[推荐]

3.1下载源码

https://github.com/EugenePig/ik-analyzer-solr5

 

3.2 手动使用maven编译jar包

摘自:https://github.com/EugenePig/ik-analyzer-solr5/blob/master/README.md

3.3 编译结果:

该包内部结构:自己包含了所需的配置文件

3.4 拷贝jar到solrcloud所有节点中

拷贝到所有节点的目录/usr/local/src/solr-5.5.0/server/solr-webapp/webapp/WEB-INF/lib中

3.5配置solr的schema.xml

<!-- libing add  2016 - 04 - 06  IK Analyzer  -->
   <fieldTypename= "text_ik" class = "solr.TextField" >
      <analyzertype= "index" useSmart= "false"
         class = "org.wltea.analyzer.lucene.IKAnalyzer" />
      <analyzertype= "query" useSmart= "true"
         class = "org.wltea.analyzer.lucene.IKAnalyzer" />
   </fieldType>

3.6 重新创建collection

3.7 分词测试

使用text_ik分词:

 

对比text_general分词效果:

3.8 高亮查询测试

 
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值