solr 配置中文分词

最新推荐文章于 2020-10-16 15:08:09 发布

litxuf

最新推荐文章于 2020-10-16 15:08:09 发布

阅读量113

点赞数

分类专栏： lucene solr

本文链接：https://blog.csdn.net/litxuf/article/details/84389394

版权

lucene 同时被 2 个专栏收录

4 篇文章 0 订阅

订阅专栏

solr

2 篇文章 0 订阅

订阅专栏

要在中文的项目中使用 Solr ，少不了要集成中文分词组件。本篇以 IK2012 分词为例，讲解如何在 solr 3.5 中及集成中文分词，使用 IK 的原因 IK 比其他中文分词维护的勤快，和 Solr 集成也相对容易。

首先需要弄到 IKAnalyzer2012.jar ，可以从这里下载到

http://code.google.com/p/ik-analyzer/downloads/list

这里选择 IKAnalyzer2012_u5.zip 下载，下载后解压，将解压出来的 IKAnalyzer2012.jar 复制出来。在 D:\apache-solr-3.5.0\example\solr 下新建 lib 目录，将 IKAnalyzer2012.jar 放入 lib 下。打开 “D:\apache-solr-3.5.0\example\solr\conf\schema.xml” ，在 types 节点下添加

< fieldType name = "text_zh" class = "solr.TextField" positionIncrementGap = "100" >

< analyzer type = "index" >

< tokenizer class = "org.wltea.analyzer.solr.IKTokenizerFactory" useSmart = "false" />

</ analyzer >

< analyzer type = "query" >

< tokenizer class = "org.wltea.analyzer.solr.IKTokenizerFactory" useSmart = "false" />

</ analyzer >

</ fieldType >

然后在 fields 节点下引用 text_zh 这一字段类型，如下所示：

 
    
         < 
         field 
         name 
         = 
         "title" 
         type 
         = 
         "text_zh" 
         indexed 
         = 
         "true" 
         stored 
         = 
         "true" 
         /> 
        
 
  

这样标题字段就支持中文分词了。

原文地址:http://www.solrcn.com/?tag=solr%E4%B8%AD%E6%96%87%E5%88%86%E8%AF%8D

litxuf

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
solr 配置中文分词

要在中文的项目中使用 Solr ，少不了要集成中文分词组件。本篇以 IK2012 分词为例，讲解如何在 solr 3.5 中及集成中文分词，使用 IK 的原因 IK 比其他中文分词维护的勤快，和 Solr 集成也相对容易。首先需要弄到 IKAnalyzer2012.jar ，可以从这里下载到http://code.google.com/p/ik-analyzer/downl...
复制链接

扫一扫