Ansj中文分词Java开发小记

原创 2016年08月29日 14:16:55

1、ansj中文分词器:https://github.com/NLPchina/ansj_seg


   基于n-Gram+CRF+HMM的中文分词的java实现.
   分词速度达到每秒钟大约200万字左右(mac air下测试),准确率能达到96%以上;
   目前实现了中文分词、中文姓名识别、用户自定义词典、关键字提取、自动摘要、关键字标记等功能;

   可以应用到自然语言处理等方面,适用于对分词效果要求高的各种项目。


2、http://maven.nlpcn.org/org/ansj/ansj_seg/

   下载ansj_seg-5.0.2-all-in-one.jar,引入eclipse工程;


3、代码:

 package cn.ansj;

import org.ansj.splitWord.analysis.ToAnalysis;

public class SplitWordsByAnsj {
	
	public static void main(String args[]) {
		String str = "欢迎使用ansj_seg,(ansj中文分词)在这里如果你遇到什么问题都可以联系我.我一定尽我所能.帮助大家.ansj_seg更快,更准,更自由!" ;
		System.out.println(ToAnalysis.parse(str));
	}
	
}


版权声明:本文为博主原创文章,未经博主允许不得转载。

相关文章推荐

【Java】Java中文分词器Ansj的使用

以前都是用C++对中文进行分词,也用过Python的“结巴”分词,最近用了一下Java的Ansj中文分词,感觉还不错。 下面是用Ansj对中文进行分词的一个简单例子,希望能对大家有用。 1.下载A...

【Java】Java中文分词器Ansj的使用

以前都是用C++对中文进行分词,也用过Python的“结巴”分词,最近用了一下Java的Ansj中文分词,感觉还不错。 下面是用Ansj对中文进行分词的一个简单例子,希望能对大家有用。 ...

ansj分词史上最详细教程

最近的项目需要使用到分词技术。本着不重复造轮子的原则,使用了ansj_seg来进行分词。本文结合博主使用经过,教大家用最快的速度上手使用ansj分词。1.给ansj来个硬广...

Ansj中文分词Java开发词性分类

用ansj分词后,只提取满足提交的词性的单词。 Ansj下载地址:http://maven.ansj.org/org/ansj/ansj_seg/ 辅助包NLP下载地址:http://maven....

Ansj中文分词说明

Ansj分词 这是一个基于n-Gram+条件随机场模型的中文分词的java实现. 分词速度达到每秒钟大约200万字左右(mac air下测试),准确率能达到96%以上 目前实现了.中文分词. 中...

Ansj中文分词使用教程

摘要: ansj是一个基于n-Gram+CRF+HMM的中文分词的java实现. ansj分词速度达到每秒钟大约200万字左右(mac air下测试),准确率能达到96%以上 Ansj目前实现了.中文...

ansj分词器的配置

到https://github.com/ansjsun/ansj_seg下载,点击右下角的Download ZIP下载 总共有两种方式: 1.可以采用POM.XML自动配置安装,在eclipse需...

中文分词项目(开源/API接口)总结

中文分词项目(开源/API接口)总结

Java中文分词工具AnsjSeg使用

中文分词是进行中文文本分析的一个重要步骤。对于Java语言,有许多可选的分词工具,如中科院计算所的NLPIR(原ICTCLASS)、盘古分词、IKAnalyzer、PaodingAnalyzer,其中...
  • hfut_jf
  • hfut_jf
  • 2015年01月14日 22:26
  • 4616

Delphi7高级应用开发随书源码

  • 2003年04月30日 00:00
  • 676KB
  • 下载
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:Ansj中文分词Java开发小记
举报原因:
原因补充:

(最多只允许输入30个字)