Lucene获取分词后的关键字

整理了一下 

String keyWord = "java是一种可以撰写跨平台应用软件的面向对象的程序设计语言。";

IKAnalyzer analyzer = new IKAnalyzer();
System.out.println("分词:"+keyWord);
try {
	TokenStream tokenStream = analyzer.tokenStream("content",new StringReader(keyWord));
    tokenStream.addAttribute(CharTermAttribute.class);


   //必须先调用reset方法,否则会报下面的错,可以参考TokenStream的API说明
   tokenStream.reset();

   /* java.lang.IllegalStateException: 
	  TokenStream contract violation: reset()/close() call missing, 
	  reset() called multiple times, or subclass does not call super.reset(). 
	  Please see Javadocs of TokenStream class for more information 
	  about the correct consuming workflow.
   */
	
  System.out.print("结果:");
  while (tokenStream.incrementToken()) {
        CharTermAttribute charTermAttribute = 
                   (CharTermAttribute)tokenStream.getAttribute(CharTermAttribute.class);
        System.out.print(charTermAttribute.toString() + " ");
   }

 tokenStream.end();
 tokenStream.close();

} catch(Exception e) {
	e.printStackTrace();
}

lucene 4.9.0

ikanalyzer 2012FF_u1

转载于:https://my.oschina.net/LinuxDaxingxing/blog/796991

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值