lucene配置IKanalyzer词典

原创 2013年12月05日 10:27:00

在java工程中,src文件夹下放置IKAnalyzer.cfg.xml

在IKAnalyzer.cfg.xml中配置


<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">  
<properties>  
<comment>IK Analyzer 扩展配置</comment>
<!--用户可以在这里配置自己的扩展字典 -->
<entry key="ext_dict">ext.dic;chengyusuyu.dic;dilidizhicihuidaquan.dic;dianshijumingdaquan.dic;huaxuehuagongcihuidaquan.dic;
jisuanjicihuidaquan.dic;jinrongciku.dic;meijupian.dic;quantangshiciku.dic;sogoucikudaochu.dic;wangluoliuxingxinci.dic;</entry> 

<!--用户可以在这里配置自己的扩展停止词字典-->
<entry key="ext_stopwords">stopword.dic;chinese_stopword.dic;</entry> 

</properties>


貌似只能加入英文,数字和中文都不行,词典和IKAnalyzer.cfg.xml放在同一目录(src)下,执行时,会显示

加载扩展词典:ext.dic
加载扩展词典:chengyusuyu.dic
加载扩展词典:dilidizhicihuidaquan.dic
加载扩展词典:dianshijumingdaquan.dic
加载扩展词典:huaxuehuagongcihuidaquan.dic
加载扩展词典:jisuanjicihuidaquan.dic
加载扩展词典:jinrongciku.dic
加载扩展词典:meijupian.dic
加载扩展词典:quantangshiciku.dic
加载扩展词典:sogoucikudaochu.dic
加载扩展词典:wangluoliuxingxinci.dic
加载扩展停止词典:stopword.dic
加载扩展停止词典:chinese_stopword.dic


即可

相关文章推荐

Lucene—IKAnalyzer分词器配置扩充词典

一.IKAnalyzer包 Ik分词器下载地址:点击打开链接 解压之后将IKAnalyzer包加入到自己的工程. 二.IK分词独立使用 (1)程序目录结构   (2)示例程序:IKAnalyzerT...
  • csmnjk
  • csmnjk
  • 2016年06月29日 13:28
  • 1921

IKAnalyzer 独立使用 配置扩展词典

有三点要注意(要不然扩展词典始终不生效): 后缀名.dic的词典文件,必须如使用文档里所说的 无BOM的UTF-8编码保存的文件。如果不确定什么是  无BOM的UTF-8编码,最简单的方式就是用...

使用IKAnalyzer分词计算文章关键字并分享几个分词词典

这应该是我第二次写IK中文分词的相关东西了。话说IK真心好用,最开始就用过IK的搜索后来又用它和solr结合使用。     关于IK可以参考下官方文档的介绍,使用配置也有相关的pdf文档。htt...

IKAnalyzer使用停用词词典进行分词

@Test // 测试分词的效果,以及停用词典是否起作用 public void test() throws IOException { String text = "老爹我们都爱您!"; Con...

使用IKAnalyzer分词计算文章关键字并分享几个分词词典

转自http://my.oschina.net/zimingforever/blog/142000  这应该是我第二次写IK中文分词的相关东西了。话说IK真心好用,最开始就用过IK的...

lucene---中文分词IKAnalyzer和高亮highlighter的使用

最近lucene已经更新到lucene 3.0版本了 2.X版本的一些用法已经彻底不在支持了。  下面的例子主要是介绍中文分词器IKAnalyzer的使用和Lucene高亮显示。  lucene ...

JAVA_WEB项目之Lucene使用中文分词器IKAnalyzer3.2.8

上一篇介绍了JAVA_WEB项目之Lucene检索框架中的IndexWriter、IndexSearch优化

Apache Lucene 5.x 集成中文分词库 IKAnalyzer

Apache Lucene 5.x 集成中文分词库 IKAnalyzer 前面写过 Apache Lucene 5.x版本 示例,为了支持中文分词,我们可以使用中文分词库 IKAnalyze...
  • hj7jay
  • hj7jay
  • 2016年03月17日 10:49
  • 789

lucene4.2 + IKanalyzer2012FF_u1简单示例

package com.xnch.lucenesearch.internet; import java.io.File; import java.io.IOException; import j...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:lucene配置IKanalyzer词典
举报原因:
原因补充:

(最多只允许输入30个字)