Lucene中文分词组件 JE-Analysis 1.5.1
//采用正向最大匹配的中文分词算法,相当于分词粒度等于0MMAnalyzer analyzer = new MMAnalyzer();//参数为分词粒度:当字数等于或超过该参数,且能成词,该词就被切分出来MMAnalyzer analyzer = new MMAnalyzer(int wordLength);//字符串切分,常用于客户的关键字输入analyzer.segment(String text, String separator);词典维护API(静态方法)://增加一个新词典,采用每行一个词的读取
转载
2011-05-20 10:13:00 ·
798 阅读 ·
0 评论