java 调用 ikAnalyzer

下载地址: http://pan.baidu.com/s/1dFDffDB
解压缩后,有如下文件:

其中,lucene-core-3.6.0.jar 是作者自行加入的,编译时需要。该版本的IKAnalyzer不支持lucene4.0、lucene5.5.0,估计4.0及以上的版本都不支持。

1. 将IKAnalyzer2012.jar、lucene-core-3.6.0.jar导入工程;
2. 将IKAnalyzer.cfg.xml、stopword.dic文件拷贝到src根目录下(编译后在classes根目录下);

java调用ik做分词的示例代码:
import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.TokenStream;
import org.apache.lucene.analysis.tokenattributes.CharTermAttribute;
import org.wltea.analyzer.lucene.IKAnalyzer;

import java.io.IOException;
import java.io.StringReader;

public class IKAnalyzerDemo {
public static void main(String[] args) throws IOException{
String text = "小孩不听话怎么办?吃东坡肉啊!";

//创建分词对象
Analyzer anal = new IKAnalyzer(true);
StringReader reader = new StringReader(text);
//分词
TokenStream ts = anal.tokenStream("", reader);
CharTermAttribute term = ts.getAttribute(CharTermAttribute.class);
//遍历分词数据
while(ts.incrementToken()){
System.out.print(term.toString() + "|");
}
reader.close();
System.out.println();
}

}
执行结果:
————————————————————————————————————
加载扩展停止词典:stopword.dic
小孩|不听话|怎么办|吃|东坡肉|啊|

Process finished with exit code 0
————————————————————————————————————

参考:
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值