分词
梅八哥
懒人推动技术进步
展开
-
mmseg4j自定义添加词典方法
将jar包源码中的data/words.dic拷贝出来,必须放在项目的src下的data文件夹下,且不能改名;然后编辑words.dic,在所有词的后面添加要添加的词,默认它会将jar包源码中的words.dic覆盖,以此方法达到自定义添加分词的功能!...2013-07-22 16:24:58 · 409 阅读 · 0 评论 -
mmseg4j分词
mmseg4j分词,所需jar:mmseg4j-analysis-1.9.1.jar,mmseg4j-core-1.9.1.jar。public class Demo { public static void main(String[] args) throws IOException { String txt = "十动然拒思密达"; File...原创 2014-10-08 10:14:52 · 135 阅读 · 0 评论 -
NLPIR分词器javademo2016改编---非开源
该项目并非开源项目:fail!E:\data\NLPIR\Data\NLPIR.user Not valid license or your license expired! Please feel free to contact pipy_zhang@msn.com! 官网下载压缩包,http://ictclas.nlpir.org/downloads java版运行需要jna-4...2016-06-20 16:08:13 · 147 阅读 · 0 评论 -
常用中文分词器
分词器:1、word分词器2、ansj分词器3、mmseg4j分词器4、ik-analyzer分词器5、jcseg分词器6、fudannlp分词器7、smartcn分词器8、jieba分词器9、stanford分词器10、hanlp分词器 测试评估报告:https://github.com/ysc/cws_evaluation ...原创 2015-12-11 17:38:35 · 1168 阅读 · 0 评论