IKAnalyzer 分词的用法

最新推荐文章于 2024-06-14 09:47:15 发布

王stone

最新推荐文章于 2024-06-14 09:47:15 发布

阅读量626

点赞数

文章标签： IKAnalyzer

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wangguoqing_it/article/details/50164843

版权

IKAnalyzer2013.zip

此文件在上一篇博客中

下载IKAnalyzer2013.zip文件解压

在eclipse中新建web项目——》打开项目的路径，讲解压后的文件拷贝的项目src目录下

回到eclipse开发页面，刷新项目即可

新建测试类具体代码如下：

package org.wltea.analyzer.test;

import java.io.IOException;

import java.io.StringReader;

import org.apache.lucene.analysis.Analyzer;

import org.apache.lucene.analysis.TokenStream;

import org.apache.lucene.analysis.tokenattributes.CharTermAttribute;

import org.wltea.analyzer.lucene.IKAnalyzer;

/**

*

* @ClassName: LuceneIndexAndSearchDemo

* @Description: IKAnalyzer demo

* @author 二凡

* @date 2015年12月3日

*

*/

public class LuceneIndexAndSearchDemo {

/**

*

* @Title: main

* @Description: TODO(这里用一句话描述这个方法的作用)

* @param @param args 参数

* @return void 返回类型

* @throws

*/

public static void main(String[] args){

//检索内容

//String text = "IK Analyzer是一个结合词典分词和文法分词的中文分词开源工具包。它使用了全新的正向迭代最细粒度切分算法。";

String text = "请问五道口到中国人民大学怎么走的？";

//String text = "2012年欧洲杯四强赛";

//实例化IKAnalyzer分词器

StringReader reader = new StringReader(text);

Analyzer analyzer = new IKAnalyzer(true);

TokenStream ts;

try {

ts = analyzer.tokenStream("", reader);

CharTermAttribute term = (CharTermAttribute) ts.getAttribute(CharTermAttribute.class);

ts.reset();

String txt = "";

while (ts.incrementToken()) {

txt = txt + term.toString() + "\t";

}

System.out.print(txt);

} catch (IOException e1) {

e1.printStackTrace();

}

reader.close();

}

}

配置分词文件 IKAnalyzer.cfg.xml

自定义字典文件：ext.dic 扩展停止词字典chineseStopword.dic ， stopword.dic

配置分词字典：

请记住：

IKAnalyzer.cfg.xml 自定义字典文件：ext.dic 扩展停止词字典chineseStopword.dic ， stopword.dic 需放在项目的 src 目录下

配置完毕后：测试

运行结果

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
IKAnalyzer 分词的用法

此文件在上一篇博客中下载IKAnalyzer2013.zip文件解压在eclipse中新建web项目——》打开项目的路径，讲解压后的文件拷贝的项目src目录下回到eclipse开发页面，刷新项目即可新建测试类具体代码如下：package org.wltea.analyzer.test;import java.io.IOException;import java.
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。