![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
中文分词
文章平均质量分 67
hello9050
这个作者很懒,什么都没留下…
展开
-
条件随机场 (CRF) 分词序列谈之一
标签:休闲 条件随机场 中文分词 特征抽取 由字构词 CRF 职场原创作品,允许转载,转载时请务必以超链接形式标明文章 原始出处 、作者信息和本声明。否则将追究法律责任。http://langiner.blog.51cto.com/1989264/379166条件随机场 (CRF) 分词序列谈之一Langiner判别式机器学习技术来解决分词问题,其中判别式机器学转载 2012-04-28 13:10:05 · 1194 阅读 · 0 评论 -
中文分词技术一席谈之典型分词方法漫谈
2010-08-20 13:35:28标签:自然语言处理 搜索 分词 文本分析 数据挖掘 休闲 职场原创作品,允许转载,转载时请务必以超链接形式标明文章 原始出处 、作者信息和本声明。否则将追究法律责任。http://langiner.blog.51cto.com/1989264/380563中文分词技术一席谈之典型分词方法漫谈LanginerLan转载 2012-04-28 13:07:41 · 1001 阅读 · 0 评论 -
14款中文分词开源软件
链接:http://www.oschina.net/project/tag/264/segment 开源中国社区1、IKAnalyzerIKAnalyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始,IKAnalyzer已经推出 了3个大版本。最初,它是以开源项目Luence为应用主体的,结合词典分词和文法分析算法的中文分词转载 2012-08-21 10:53:10 · 26722 阅读 · 1 评论 -
中科院中文分词C语言接口调用示例
#include "ICTCLAS50.h"#include #include #include int main(int argc, char **argv) {// char * sResult;if(!ICTCLAS_Init()){printf("init fail\n");return -1;}else{printf("ok\n");转载 2012-08-27 14:51:17 · 2678 阅读 · 1 评论 -
K条最短路径问题
最短路径的并行算法综述 中国科技大学 陈艾通常情况下,最短路径问题分为:单源最短路径和所有顶点对间的最短路径。这两类问题从不同的角度描述问题,但有一个共同的缺陷:这里的最短路径指两点之间最短的那一条路径,不包括次短、再次短等等路径。这样的最短路径问题比较狭义。实际情况中,例如,用户在使用咨询系统或决策支持系统时,希望得到最优的决策参考外,还希望得到次优、再次优等决策参考,这同样反映在最短路转载 2012-09-06 15:38:57 · 4738 阅读 · 0 评论 -
基于词表的分词——最大匹配(MM)
这是一种有着广泛应用的机械分词方法,该方法依据一个分词词表和一个基本的切分评估原则,即“长词优先”原则,来进行分词。这种评估原则虽然在大多数情况下是合理的,但也会引发一些切分错误。这种切分方法,需要最少的语言资源(仅需一个词表,不需要任何词法、句法、语义知识),程序实现简单,开发周期短,是一个简单实用的方法。 下面是一个简单的MM算法Python实现: 1 #{entry1转载 2012-09-06 16:08:46 · 1352 阅读 · 0 评论 -
基于词表的切词——最短路径方法
最短路径方法的目的是使得分词后得到的词最少,实现的方法是从句子中匹配出所有在词表中的词,以词为边(边的权重为1)、词与词的间隔(切分点)为节点构造出一个有向无环图(DAG),有唯一的起点(句子的开始)和唯一的终点(句子的结束),找到一条最短路径,即切分最少。 和正向最大匹配一样最短路径方法只需要一个词表即可进行切词,但得到的结果要更好,主要原因是考虑到了上下文的衔接性,把切分过程从转载 2012-09-06 16:07:50 · 1157 阅读 · 0 评论