lucene配置IKanalyzer词典

原创 2013年12月05日 10:27:00

在java工程中,src文件夹下放置IKAnalyzer.cfg.xml

在IKAnalyzer.cfg.xml中配置


<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">  
<properties>  
<comment>IK Analyzer 扩展配置</comment>
<!--用户可以在这里配置自己的扩展字典 -->
<entry key="ext_dict">ext.dic;chengyusuyu.dic;dilidizhicihuidaquan.dic;dianshijumingdaquan.dic;huaxuehuagongcihuidaquan.dic;
jisuanjicihuidaquan.dic;jinrongciku.dic;meijupian.dic;quantangshiciku.dic;sogoucikudaochu.dic;wangluoliuxingxinci.dic;</entry> 

<!--用户可以在这里配置自己的扩展停止词字典-->
<entry key="ext_stopwords">stopword.dic;chinese_stopword.dic;</entry> 

</properties>


貌似只能加入英文,数字和中文都不行,词典和IKAnalyzer.cfg.xml放在同一目录(src)下,执行时,会显示

加载扩展词典:ext.dic
加载扩展词典:chengyusuyu.dic
加载扩展词典:dilidizhicihuidaquan.dic
加载扩展词典:dianshijumingdaquan.dic
加载扩展词典:huaxuehuagongcihuidaquan.dic
加载扩展词典:jisuanjicihuidaquan.dic
加载扩展词典:jinrongciku.dic
加载扩展词典:meijupian.dic
加载扩展词典:quantangshiciku.dic
加载扩展词典:sogoucikudaochu.dic
加载扩展词典:wangluoliuxingxinci.dic
加载扩展停止词典:stopword.dic
加载扩展停止词典:chinese_stopword.dic


即可

Lucene—IKAnalyzer分词器配置扩充词典

一.IKAnalyzer包 Ik分词器下载地址:点击打开链接 解压之后将IKAnalyzer包加入到自己的工程. 二.IK分词独立使用 (1)程序目录结构   (2)示例程序:IKAnalyzerT...
  • csmnjk
  • csmnjk
  • 2016年06月29日 13:28
  • 2346

Lucene-IKAnalyzer(中文分词)基于配置的词典扩充

Lucene-IKAnalyzer(中文分词)基于配置的词典扩充
  • fangjingjingll
  • fangjingjingll
  • 2015年10月14日 13:51
  • 898

Lucene建立索引 使用IKAnalyzer扩展词库

转载原文:http://blog.163.com/iamlyia0_0/blog/static/50957997201481510100729/ 方案一: 基于配置的词典扩充 项目结构图如...
  • chuntian_feng
  • chuntian_feng
  • 2016年07月10日 14:03
  • 1136

IKAnalyzer 独立使用 配置扩展词典

public class IIKAnalyzerTest {     public static void main(String[] args) throws IOException {  ...
  • main_xtgjfge
  • main_xtgjfge
  • 2012年10月09日 15:11
  • 3185

Lucene-IKAnalyzer使用

import java.io.IOException; import org.apache.lucene.document.Document; import org.apache.lucene.doc...
  • zmken497300
  • zmken497300
  • 2016年10月14日 15:16
  • 1145

IKAnalyzer结合Lucene使用和单独使用例子 简单性能测试

IKAnalyzer是一个开源基于JAVA语言的轻量级的中文分词第三方工具包,采用了特有的“正向迭代最细粒度切分算法“,支持细粒度和智能分词两种切分模式。刚开始使用的时候,发现不能支持中文和字母混合的...
  • linzhichao12345
  • linzhichao12345
  • 2014年11月26日 15:20
  • 1271

Lucene使用IKAnalyzer中文分词笔记 Jialy Jialy

IKAnalyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包。
  • gebitan505
  • gebitan505
  • 2016年06月17日 16:01
  • 585

IKAnalyzer词典扩充

IKAnalyzer词典扩充最近工作使用到lucene,需要对中文分词,分词器是IKAnalyzer,自带的词典包含了27万词条,能满足一般的分词要求,但是如果应用到特定的专业领域,还需要扩展专业词库...
  • u012334071
  • u012334071
  • 2015年06月15日 09:57
  • 2112

IKAnalyzer添加用户自定字典

IKAnalyzer添加用户自定字典 1. 部署IKAnalyzer.cfg.xml IKAnalyzer.cfg.xml部署在代码根目彔下(对亍web项目,通常是WEB-INF/clas...
  • liangpz521
  • liangpz521
  • 2015年06月25日 17:01
  • 1331

基于Lucene7 IKAnalyzer 报错问题

新增2个类 *********************************************************************************************...
  • bowen_bao
  • bowen_bao
  • 2017年12月06日 11:07
  • 107
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:lucene配置IKanalyzer词典
举报原因:
原因补充:

(最多只允许输入30个字)