(自然语言处理文档系列)Penn Treebank词性标记集

原创 2015年07月06日 17:02:22

Penn Treebank词性标记集

在进行自然语言处理时,常见的任务是对单词进行词性标注,但对于标注的结果我们有时候不是很明白,文章介绍了对于常见的标注结果的中文含义:

编号 缩写 英文 中文
1 CC Coordinating conjunction 并列连接词
2 CD Cardinal number 基数
3 DT Determiner 限定词
4 EX Existential there 存在型there
5 FW Foreign word 外文单词
6 IN Preposition/subord, conjunction 介词/从属,连接词
7 JJ Adjective 形容词
8 JJR Adjective, comparative 形容词,比较级
9 JJS Adjective, superlative 形容词,最高级
10 LS List item marker 列表项标记
11 MD Modal 情态动词
12 NN Noun ,singular or mass 名词,可数或不可数
13 NNS Noun, plural 名词,复数
14 NNP Proper noun, singular 专有名词,单数
15 NNPS Proper noun, plural 专有名词,复数
16 PDT Predeterminer 前位限定词
17 POS Possessive ending 所有格结束词
18 PRP Personal pronoun 人称代名词
19 PP$ Possessive pronoun 物主代词,所有格代名词
20 RB Adverb 副词
21 RBR Adverb, comparative 副词,比较级
22 RBS Adverb, superlative 副词,最高级
23 RP Particle 小品词
24 SYM Symbol(mathematical or scientific) 符号(数学或科学)
25 TO to To
26 UH Interjection 感叹词
27 VB Verb, base form 动词,基本形态
28 VBD Verb, past tense 动词,过去式
29 VBG Verb, gerund/present participle 动词,动名词/现在分词
30 VBN Verb, past participle 动词,过去分词
31 VBP Verb, non-3rd ps. sing. Present 动词,非第三人称单数现在式
32 VBZ Verb, 3rd ps. sing. Present 动词,第三人称单数现在式
33 WDT wh-determiner wh-限定词
34 WP wh-pronoun wh-代词
35 WP$ Possessive wh-pronoun 所有格wh-代词
36 WRB wh-adverb wh-副词
37 # Pound sign #符号
38 $ Dollar sign 美元符号
39 . Sentence-final punctuation 句点
40 , Comma 逗号
41 : Colon, semi-colon 冒号,分号
42 ( Left bracket character 左括号
43 ) Right bracket character 右括号
44 “ Straight double quote 双引号
45 ‘ Left open single quote 左单引号
46 “ Left open double quote 左双引号
47 ’ Right close single quote 右单引号
48 ” Right close double quote 右双引号

宾州中文树库标记以及其解释, Penn Chinese Treebank Tag Set

The Chinese Penn Treebank Tag Set 1        Part-Of-Speech tags: 33 tags   标记 英语解释 ...
  • neuTblue
  • neuTblue
  • 2012年03月20日 19:00
  • 13455

stanfordSentimentTreebank 的映射关系

在stanfordSentimentTreebank中  有好几个txt文件 下面我来梳理下这个东西 datasetSentences.txt: 里面分别是 sentence_index,  sent...

tensorflow——rnn(penn tree bank)

采用lstm对ptb数据集进行自然语言处理

Penn Treebank词性标记集

转载的 编号 缩写 英文 中文 1 CC Coordinating conjunction 并列连接词 2 CD Cardinal number 基数 3 DT Determiner 限定词 ...

The PennTreebank POS tagset

1.CC  Coordinating conjunction(并列连词)     25.TO to 2.CD  Cardinal number(基数)                  26.UH...
  • x_yz_
  • x_yz_
  • 2013年05月11日 19:06
  • 1438

Django 编写Rss订阅

在urls.py中添加''' from blog.feed import LatestEntriesFeed (r'^latest/feed/$', LatestEntriesFeed()),...
  • clh604
  • clh604
  • 2013年06月25日 15:40
  • 1222

Django开发之添加RSS订阅源

为自己的博客添加一个订阅源

词性标记说明(Penn Treebank Tagset 宾州树库)

转自:http://blog.csdn.net/wskings/article/details/17607021 最近在做命名实体识别,用到Stanford-CoreNlp词性标记,由于不是语言学...

统计自然语言处理梳理一:分词、命名实体识别、词性标注

进行统计自然语言处理系统梳理,学习资料《统计自然语言处理.宗成庆》。 一、自动分词          词,词是最小的能够独立运用的语言单位。          自动分词问题由来。中文(还有日语、...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:(自然语言处理文档系列)Penn Treebank词性标记集
举报原因:
原因补充:

(最多只允许输入30个字)