词性标注,句法分析中NN,NP是什么意思

TreeBank是一种标注了句法和语义句子结构的大型语料库,这些句法结构通常是树的形式,所以称之为TreeBank(树库)。The Penn TreeBank是第一个提出的TreeBank语料库,这个语料库使用的词性标注的类别包含了NN,NP。

必须要知道正式表示和用于存储注释数据的文件格式之间有很大的区别。树库必须根据特定的语法构建。不同的文件格式可以实现相同的语法。例如,右图所示的John Loves Mary的句法分析可以用文本文件中的简单标记括号表示,如下所示(遵循Penn Treebank表示法):

在这里插入图片描述
上述句法分析树的存储结构如下所示:
(S (NP (NNP John))
(VP (VPZ 爱)
(NP (NNP Mary)))
(…))

这种表示方式很受欢迎,因为它占用资源少,而且树状结构在没有软件工具的情况下相对容易阅读。然而,随着语料库变得越来越复杂,其他文件格式可能是首选。替代方案包括特定于树库的XML方案、编号缩进和各种类型的间隔符号。

TREEBANK中的词性标签

NumberTagDescription中文翻译
1.CCCoordinating conjunction对等连词,对等连词
2.CDCardinal number基数
3.DTDeterminer限定词(置于名词前起限定作用,如 the、some、my 等)
4.EXExistential there存在句
5.FWForeign word外来语;外来词;外文原词
6.INPreposition or subordinating conjunction介词或者从属连词
7.JJAdjective形容词
8.JJRAdjective, comparative比较级形容词,例子:better(更好的)
9.JJSAdjective, superlative最高级形容词,例子:best(最好的)
10.LSList item marker列表项标记
11.MDModal情态动词,在语法中,情态动词或情态助动词是一个如“can”或“would”之类的词,它与主动词连用,用来表达可能性、意图或必要性等观点
12.NNNoun, singular or mass名词,单数或质量
13.NNSNoun, plural名词,复数
14.NNPProper noun, singular专有名词,单数
15.NNPSProper noun, plural专有名词,复数
16.PDTPredeterminer前位限定词,在语法中,一个前位限定词是一个词,使用在限定词之前,但仍然是名词组的一部分。例如,‘all’ in ‘all the time’ and ‘both’ in 'both our children’是前位限定词。
17.POSPossessive ending所有格结尾。全部写法:所有格的写法一般是用“'s“和“of”表示。一般写法:一般常用:“'s”表示
18.PRPPersonal pronoun人称代词
19.PRP$Possessive pronoun物主代词,物主代词有形容词性(my, your等)和名词性(mine, yours等)两种,形容词性的物主代词属于限定词。
20.RBAdverb副词
21.RBRAdverb, comparative副词、比较级
22.RBSAdverb, superlative副词,最高级
23.RPParticle小品词(与动词构成短语动词的副词或介词)
24.SYMSymbol符号
25.TOto
26.UHInterjection感叹词;感叹语
27.VBVerb, base form动词原形
28.VBDVerb, past tense动词过去式
29.VBGVerb, gerund or present participle动词、动名词或现在分词
30.VBNVerb, past participle动词过去分词
31.VBPVerb, non-3rd person singular present动词,非第三人称单数现在时
32.VBZVerb, 3rd person singular present动词,第三人称单数现在时
33.WDTWh-determinerWH限定词
34.WPWh-pronounWH-代词
35.WP$Possessive wh-pronoun所有格wh-代词
36.WRBWh-adverbWWh-副词
参考资料

【1】https://www.ling.upenn.edu/courses/Fall_2003/ling001/penn_treebank_pos.html

  • 7
    点赞
  • 38
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值