关闭

Ansj中文分词Java开发小记

3358人阅读 评论(0) 收藏 举报
分类:

1、ansj中文分词器:https://github.com/NLPchina/ansj_seg


   基于n-Gram+CRF+HMM的中文分词的java实现.
   分词速度达到每秒钟大约200万字左右(mac air下测试),准确率能达到96%以上;
   目前实现了中文分词、中文姓名识别、用户自定义词典、关键字提取、自动摘要、关键字标记等功能;

   可以应用到自然语言处理等方面,适用于对分词效果要求高的各种项目。


2、http://maven.nlpcn.org/org/ansj/ansj_seg/

   下载ansj_seg-5.0.2-all-in-one.jar,引入eclipse工程;


3、代码:

 package cn.ansj;

import org.ansj.splitWord.analysis.ToAnalysis;

public class SplitWordsByAnsj {
	
	public static void main(String args[]) {
		String str = "欢迎使用ansj_seg,(ansj中文分词)在这里如果你遇到什么问题都可以联系我.我一定尽我所能.帮助大家.ansj_seg更快,更准,更自由!" ;
		System.out.println(ToAnalysis.parse(str));
	}
	
}


0
0
查看评论

ansj分词史上最详细教程

最近的项目需要使用到分词技术。本着不重复造轮子的原则,使用了ansj_seg来进行分词。本文结合博主使用经过,教大家用最快的速度上手使用ansj分词。1.给ansj来个硬广
  • bitcarmanlee
  • bitcarmanlee
  • 2016-12-13 11:29
  • 15257

【Java】Java中文分词器Ansj的使用

以前都是用C++对中文进行分词,也用过Python的“结巴”分词,最近用了一下Java的Ansj中文分词,感觉还不错。 下面是用Ansj对中文进行分词的一个简单例子,希望能对大家有用。 1.下载Ansj的相关jar包 要用Ansj进行中文分词,必须先下载Ansj的jar包,下载地址可以参考:ht...
  • xiaoguaihai
  • xiaoguaihai
  • 2014-11-26 12:57
  • 24069

ansj中文分词工具

  • 2015-08-20 19:53
  • 44.43MB
  • 下载

Java中文分词工具AnsjSeg使用

中文分词是进行中文文本分析的一个重要步骤。对于Java语言,有许多可选的分词工具,如中科院计算所的NLPIR(原ICTCLASS)、盘古分词、IKAnalyzer、PaodingAnalyzer,其中,试用过ICTCLASS及其后续版本,刚开始感觉不错,但是Java调用C语言的方式实在是受不了,没有...
  • hfut_jf
  • hfut_jf
  • 2015-01-14 22:26
  • 5413

Ansj中文分词Java开发自定义和过滤词库

Ansj中文分词应用时,需要自定义词库,比如城中村,分词成城、中、村,需自定义词库,有时,也需要过滤单词。具体代码如下,可以结合执行结果看代码效果。 1、过滤词库 package csc.ansj; import org.ansj.domain.Result; import org.ansj....
  • fjssharpsword
  • fjssharpsword
  • 2016-11-23 15:39
  • 7670

【Java】Java中文分词器Ansj的使用

以前都是用C++对中文进行分词,也用过Python的“结巴”分词,最近用了一下Java的Ansj中文分词,感觉还不错。 下面是用Ansj对中文进行分词的一个简单例子,希望能对大家有用。 1.下载Ansj的相关jar包 要用Ansj进行中文分词,必须先下载Ansj的jar包,...
  • qq_26562641
  • qq_26562641
  • 2015-12-17 13:46
  • 2966

ansj_seg-5.1.3.jar

  • 2017-09-04 16:00
  • 19.72MB
  • 下载

ansj_seg-5.0.0

  • 2016-07-29 14:37
  • 19.68MB
  • 下载

Ansj中文分词使用教程

摘要: ansj是一个基于n-Gram+CRF+HMM的中文分词的java实现. ansj分词速度达到每秒钟大约200万字左右(mac air下测试),准确率能达到96%以上 Ansj目前实现了.中文分词.词性识别. 中文姓名识别 . 用户自定义词典,关键字提取,自动摘要,关键字标记等功能 可以应用...
  • a822631129
  • a822631129
  • 2016-08-26 19:48
  • 12178

ansj_seg 学习,自定义词典加载

原文地址http://blog.csdn.net/bitcarmanlee/article/details/53607776 最近需要使用分词搜索,在网上查找了许多,看了很多分词工具的对比,感觉这个还是非常不错的,相比较与ik更适合我们使用 1.给ansj来个硬广 项目的github地址:h...
  • jayzym
  • jayzym
  • 2017-08-22 16:01
  • 1205
    个人资料
    • 访问:2031629次
    • 积分:28119
    • 等级:
    • 排名:第230名
    • 原创:783篇
    • 转载:62篇
    • 译文:1篇
    • 评论:191条
    博客专栏
    文章分类
    最新评论