分词
梅八哥
懒人推动技术进步
展开
-
mmseg4j自定义添加词典方法
将jar包源码中的data/words.dic拷贝出来,必须放在项目的src下的data文件夹下,且不能改名; 然后编辑words.dic,在所有词的后面添加要添加的词,默认它会将jar包源码中的words.dic覆盖, 以此方法达到自定义添加分词的功能! ...2013-07-22 16:24:58 · 369 阅读 · 0 评论 -
mmseg4j分词
mmseg4j分词,所需jar:mmseg4j-analysis-1.9.1.jar,mmseg4j-core-1.9.1.jar。 public class Demo { public static void main(String[] args) throws IOException { String txt = "十动然拒思密达"; File...原创 2014-10-08 10:14:52 · 115 阅读 · 0 评论 -
NLPIR分词器javademo2016改编---非开源
该项目并非开源项目:fail!E:\data\NLPIR\Data\NLPIR.user Not valid license or your license expired! Please feel free to contact [email protected]! 官网下载压缩包,http://ictclas.nlpir.org/downloads java版运行需要jna-4...2016-06-20 16:08:13 · 129 阅读 · 0 评论 -
常用中文分词器
分词器: 1、word分词器 2、ansj分词器 3、mmseg4j分词器 4、ik-analyzer分词器 5、jcseg分词器 6、fudannlp分词器 7、smartcn分词器 8、jieba分词器 9、stanford分词器 10、hanlp分词器 测试评估报告: https://github.com/ysc/cws_evaluation ...原创 2015-12-11 17:38:35 · 1118 阅读 · 0 评论