中文分词
健康平安的活着
再给我一次重生的机会,我将加倍珍惜,将java事业进行到底。
展开
-
word中文分词
word分词是一个Java实现的中文分词组件,提供了多种基于词典的分词算法,并利用ngram模型来消除歧义。 能准确识别英文、数字,以及日期、时间等数量词,能识别人名、地名、组织机构名等未登录词。 同时提供了Lucene、Solr、ElasticSearch插件。1.案例一,自定义分词;2.分词,保留分用词和不保留分用词2.计算相似度;3.词频统计4.拆词和组词5.同义词标原创 2017-03-09 17:14:04 · 1010 阅读 · 0 评论 -
ansj 分词
1.ansj的功能介绍以及特点:ansj是一个基于n-Gram+CRF+HMM的中文分词的java实现.ansj分词速度达到每秒钟大约200万字左右(mac air下测试),准确率能达到96%以上Ansj目前实现了.中文分词.词性识别.中文姓名识别 . 用户自定义词典,关键字提取,自动摘要,关键字标记等功能可以应用到自然语言处理等方面,适用于对分词效果要求高的各种项目.原创 2017-09-07 16:46:26 · 463 阅读 · 0 评论