(自然语言处理文档系列)Penn Treebank词性标记集

原创 2015年07月06日 17:02:22

Penn Treebank词性标记集

在进行自然语言处理时,常见的任务是对单词进行词性标注,但对于标注的结果我们有时候不是很明白,文章介绍了对于常见的标注结果的中文含义:

编号 缩写 英文 中文
1 CC Coordinating conjunction 并列连接词
2 CD Cardinal number 基数
3 DT Determiner 限定词
4 EX Existential there 存在型there
5 FW Foreign word 外文单词
6 IN Preposition/subord, conjunction 介词/从属,连接词
7 JJ Adjective 形容词
8 JJR Adjective, comparative 形容词,比较级
9 JJS Adjective, superlative 形容词,最高级
10 LS List item marker 列表项标记
11 MD Modal 情态动词
12 NN Noun ,singular or mass 名词,可数或不可数
13 NNS Noun, plural 名词,复数
14 NNP Proper noun, singular 专有名词,单数
15 NNPS Proper noun, plural 专有名词,复数
16 PDT Predeterminer 前位限定词
17 POS Possessive ending 所有格结束词
18 PRP Personal pronoun 人称代名词
19 PP$ Possessive pronoun 物主代词,所有格代名词
20 RB Adverb 副词
21 RBR Adverb, comparative 副词,比较级
22 RBS Adverb, superlative 副词,最高级
23 RP Particle 小品词
24 SYM Symbol(mathematical or scientific) 符号(数学或科学)
25 TO to To
26 UH Interjection 感叹词
27 VB Verb, base form 动词,基本形态
28 VBD Verb, past tense 动词,过去式
29 VBG Verb, gerund/present participle 动词,动名词/现在分词
30 VBN Verb, past participle 动词,过去分词
31 VBP Verb, non-3rd ps. sing. Present 动词,非第三人称单数现在式
32 VBZ Verb, 3rd ps. sing. Present 动词,第三人称单数现在式
33 WDT wh-determiner wh-限定词
34 WP wh-pronoun wh-代词
35 WP$ Possessive wh-pronoun 所有格wh-代词
36 WRB wh-adverb wh-副词
37 # Pound sign #符号
38 $ Dollar sign 美元符号
39 . Sentence-final punctuation 句点
40 , Comma 逗号
41 : Colon, semi-colon 冒号,分号
42 ( Left bracket character 左括号
43 ) Right bracket character 右括号
44 “ Straight double quote 双引号
45 ‘ Left open single quote 左单引号
46 “ Left open double quote 左双引号
47 ’ Right close single quote 右单引号
48 ” Right close double quote 右双引号

tensorflow——rnn(penn tree bank)

采用lstm对ptb数据集进行自然语言处理
  • upperArrow
  • upperArrow
  • 2017年02月08日 21:49
  • 569

Penn Treebank词性标记集

转载的 编号 缩写 英文 中文 1 CC Coordinating conjunction 并列连接词 2 CD Cardinal number 基数 3 DT Determiner 限定词 ...
  • jolinxia
  • jolinxia
  • 2015年11月17日 14:08
  • 586

(自然语言处理文档系列)Penn Treebank词性标记集

在进行自然语言处理时,常见的任务是对单词进行词性标注,但对于标注的结果我们有时候不是很明白,文章介绍了对于常见的标注结果的中文含义。 编号 缩写 英文 中文 1 CC Coordinat...
  • u010099495
  • u010099495
  • 2015年07月06日 17:02
  • 3212

词性标记说明(Penn Treebank Tagset 宾州树库)

转自:http://blog.csdn.net/wskings/article/details/17607021 最近在做命名实体识别,用到Stanford-CoreNlp词性标记,由于不是语言学...
  • qq_27437967
  • qq_27437967
  • 2017年05月10日 17:07
  • 767

宾州中文树库标记以及其解释, Penn Chinese Treebank Tag Set

The Chinese Penn Treebank Tag Set 1        Part-Of-Speech tags: 33 tags   标记 英语解释 ...
  • neuTblue
  • neuTblue
  • 2012年03月20日 19:00
  • 14062

Penn Treebank 词性标注集

 参考资料:http://www.ling.upenn.edu/courses/Fall_2003/ling001/penn_treebank_pos.html Alphabetical li...
  • zhaohe1995
  • zhaohe1995
  • 2017年04月21日 11:25
  • 520

stanfordSentimentTreebank 的映射关系

在stanfordSentimentTreebank中  有好几个txt文件 下面我来梳理下这个东西 datasetSentences.txt: 里面分别是 sentence_index,  sent...
  • yeyang911
  • yeyang911
  • 2017年01月12日 16:09
  • 1095

PTB文本数据集

  • 2017年09月21日 17:25
  • 33.25MB
  • 下载

Penn Tree Bank(PTB) 数据集

  • 2018年01月23日 13:42
  • 93.28MB
  • 下载

深度学习数据集Deep Learning Datasets

Datasets These datasets can be used for benchmarking deep learning algorithms: Symbolic Music Data...
  • GarfieldEr007
  • GarfieldEr007
  • 2016年03月02日 12:18
  • 4870
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:(自然语言处理文档系列)Penn Treebank词性标记集
举报原因:
原因补充:

(最多只允许输入30个字)