导言:本例用于中文的切割分词
需要导入jar包:
import java.io.IOException;
import java.io.StringReader;
import org.wltea.analyzer.core.IKSegmenter;
import org.wltea.analyzer.core.Lexeme;
public class fenci {
public static void main(String[] args) throws IOException {
String text="北京时间3月8日0时42分,马来西亚航空公司一架波音777型客机执行从马来西亚吉隆坡飞往北京(MH370)航班任务,机上共搭乘239人,包括150多名中国乘客。1时20分,飞机与地面失去联系。马来西亚航空公司发布声明称,其正与搜寻救援机构合作,以确定飞机的位置。";
StringReader stringReader=new StringReader(text);
IKSegmenter ik=new IKSegmenter(stringReader, true);
Lexeme wordLexeme=null;
while((wordLexeme=ik.next())!=null){
System.out.print(wordLexeme.getLexemeText()+"/");
}
}
}
运行结果图: