“庖丁解牛” 分词器实现

import java.io.IOException;
import java.io.StringReader;


import net.paoding.analysis.analyzer.PaodingAnalyzer;


import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.Token;
import org.apache.lucene.analysis.TokenStream;


/**
 * 类说明
 *
 * @author 曾修建
 * @version 创建时间:2014-7-17 下午05:56:54
 */
public class Cld_Analyz {
	private static String testString1 = "中华人湖发民共和国在1949年建立,从此開始了新中国的伟大篇章";
	private static String testString2 = "乒乓球拍卖完了";
	public static void Analyz() {


		Analyzer analyzer = new PaodingAnalyzer(); 
		String  indexStr = testString2; 
		StringReader reader = new StringReader(indexStr); 
		TokenStream ts = analyzer.tokenStream(indexStr, reader); 
		Token t=null;
		StringBuffer sb=new StringBuffer();
		try {
			t = ts.next();
			int i=0;
			while (t != null) {
				if(i==0){
					sb.append(t.termText());
				}
				else{
					sb.append(" AND "+t.termText());
				}
				t = ts.next();
				i++;
			} 
		} catch (IOException e) {
			e.printStackTrace();
		}
		System.out.println("结果是:      "+sb );
		analyzer.close();
	}
	public static void main(String[] args) {
		Analyz();
	}
}

执行结果:       乒乓 AND 乒乓球 AND 球拍 AND 拍卖 AND 卖完 AND 完了
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值