Lucene4.9基础学习第四步

前面几章笔者把Lucene基本入门的任督二脉给打通了,从此篇开始,就开始进行Lucene的进阶开发了,那么首先摆在我们面前的第一个必须要解决的问题,就是关于中文分词的问题,因为Lucene毕竟是国外的大牛们开发的,显然会比较侧重英文文章,不过还好,在Lucene的下载包里同步了SmartCN的分词器针对中文发行的,每一次Lucene有新的版本发行,这个包同时更新。



package com.wfc.lucene_1;

import java.io.StringReader;

import org.apache.lucene.analysis.TokenStream;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.analysis.tokenattributes.CharTermAttribute;
import org.apache.lucene.util.Version;

public class Test_1 {

	public static void main(String[] args)throws Exception {  
        //下面这个分词器,是经过修改支持同义词的分词器  
		StandardAnalyzer analyzer=new StandardAnalyzer(Version.LUCENE_4_9);  
String text="三劫散仙是一个菜鸟";  
TokenStream ts=analyzer.tokenStream("field", new StringReader(text));  
CharTermAttribute term=ts.addAttribute(CharTermAttribute.class);  
ts.reset();//重置做准备  
while(ts.incrementToken()){  
  System.out.println(term.toString());  
}  
ts.end();//  
ts.close();//关闭流  
}  
}



                                  



关于分词的知识有很多,以后补充过来。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

ItJavawfc

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值