JAVA
iteye_19064
这个作者很懒,什么都没留下…
展开
-
mmseg4j分词器
1、用 Chih-Hao Tsai 的 MMSeg 算法(http://technology.chtsai.org/mmseg/)实现的中文分词器,并实现 lucene 的 analyzer 和 solr 的TokenizerFactory 以方便在Lucene和Solr中使用。 2、MMSeg 算法有两种分词方法:Simple和Complex,都是基于正向最大匹配。Complex 加了四个...原创 2012-08-14 12:03:00 · 209 阅读 · 0 评论 -
mmseg4j分词器简单实例
import java.io.IOException; import java.io.StringReader; import com.chenlb.mmseg4j.Chunk; import com.chenlb.mmseg4j.ComplexSeg; import com.chenlb.mmseg4j.Dictionary; import com.chenlb.mmseg4j.M...原创 2012-08-14 12:04:39 · 157 阅读 · 0 评论