1.ansj_seg
github地址:https://github.com/NLPchina/ansj_seg
文档地址:http://nlpchina.github.io/ansj_seg/
分词速度快,目前实现了.中文分词. 中文姓名识别 . 用户自定义词典,关键字提取,自动摘要,关键字标记等功能。
maven配置:
<dependency>
<groupId>org.ansj</groupId>
<artifactId>ansj_seg</artifactId>
<version>5.1.1</version>
</dependency>
使用方法:
String sentence ="从创立以来,拼多多瞄准三四五线城市及县城乡镇,通过“农村包围城市”的差异化策略,主打低价拼单模式,在阿里、京东的市场垄断中异军突起。";
Result parse = ToAnalysis.parse(sentence);
System.out.println(parse.getTerms().toString() );
//分词结果
[从/p, 创立/v, 以来/f, ,/w, 拼/v, 多多/d, 瞄准/v, 三四五线/m,
城市/n, 及/c, 县城/n, 乡镇/n,