ICTCLAS分词系统研究(六)-- 词性标注

原创 2006年06月13日 10:53:00

把连在一起的汉字按词义断开只是完成分词系统的第一步,下面还有很重要的一步是对断开后的每一个词进行词性标注。有了词性标注,才能有助于我们进一步的做语法分析等更高层面的中文理解。

源程序里面反复用到一个很重要的属性叫句柄(Handle),它应该是记录词的词性信息。

。。。。。。

哈工大ltp词性标注列表和ICTCLAS词性列表

哈工大ltp词性列表Tag Description Example a adjective 美丽 b other noun-modifier 大型, 西式 c conjunct...
  • leiting_imecas
  • leiting_imecas
  • 2017年03月30日 11:50
  • 2095

ICTCLAS 汉语词性标注集 中科院

汉语文本词性标注标记集 Ag 形语素 形容词性语素。形容词代码为a,语素代码g前面置以A。 a 形容词 取英语形容词adjective的第1个字母。 ad 副形词 直接作状语...
  • memray
  • memray
  • 2013年11月03日 16:13
  • 9395

ICTCLAS2008汉语词性标注集

ICTCLAS2008 计算所汉语词性标记集Version 3.0
  • deathkon
  • deathkon
  • 2017年10月12日 16:40
  • 101

ICTCLAS分词系统研究(六)-- 词性标注

把连在一起的汉字按词义断开只是完成分词系统的第一步,下面还有很重要的一步是对断开后的每一个词进行词性标注。有了词性标注,才能有助于我们进一步的做语法分析等更高层面的中文理解。源程序里面反复用到一个很重...
  • sinboy
  • sinboy
  • 2006年06月13日 10:53
  • 6204

NLP+词法系列(一)︱中文分词技术小结、几大分词引擎的介绍与比较

笔者想说:觉得英文与中文分词有很大的区别,毕竟中文的表达方式跟英语有很大区别,而且语言组合形式丰富,如果把国外的内容强行搬过来用,不一样是最好的。所以这边看到有几家大牛都在中文分词以及NLP上越走越远...
  • sinat_26917383
  • sinat_26917383
  • 2016年11月25日 14:02
  • 14023

ICTCLAS分词系统研究(三)--原子切分

 ICTCLAS分词的第一步就是原子分词。但在进行原子切分之前,首先要进行断句处理。所谓断句,就是根据分隔符、回车换行符等语句的分隔标志,把源字符串分隔成多个稍微简单一点的短句,再进行分词处理,最后再...
  • sinboy
  • sinboy
  • 2006年03月15日 11:27
  • 10056

ICTCLAS分词系统研究(五)--N最短路径

 ICTCLAS和别的分司系统不一样的地方就是于--N最短路径分词算法。所谓N最短路径其实就是最短路径和最大路径的折中,保留前N个最优路径。这样做的目的就是对这两种方法取长补短,既能达到一个比较理解的...
  • sinboy
  • sinboy
  • 2006年05月19日 13:43
  • 14489

十、半个小时搞定词性标注与关键词提取

想要做到和人聊天,首先得先读懂对方在说什么,所以问句解析是整个聊天过程的第一步,问句解析是一个涉及知识非常全面的过程,几乎涵盖了自然语言处理的全部,本节让我们尝试一下如何分析一个问句 请尊重原创,转...
  • jiangjingxuan
  • jiangjingxuan
  • 2017年01月25日 12:07
  • 1488

哈工大LTP项目

来自哈工大官网:http://ir.hit.edu.cn/ltp/ Ltp: Language Technology Platform (下载源代码) Introduction 语言技术平台(L...
  • forever1dreamsxx
  • forever1dreamsxx
  • 2012年11月30日 11:28
  • 3415

中科院ICTCLAS分词汉语词性标记集

1. 名词 (1个一类,7个二类,5个三类) 名词分为以下子类: n 名词 nr 人名 nr1 汉语姓氏 nr2 汉语名字 nrj 日语人名 nrf 音译人名...
  • u010454729
  • u010454729
  • 2014年10月13日 15:03
  • 3336
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:ICTCLAS分词系统研究(六)-- 词性标注
举报原因:
原因补充:

(最多只允许输入30个字)