依存句法分析 -- tag和dep释义

60 篇文章 57 订阅

依存句法分析(Dependency Parsing, DP)是通过分析语言单位内成分之间的依存关系揭示其句法结构,主张橘子 中核心动词是支配其它成分的中心成分,而它本身却不受其他任何成分的支配,所有受支配成分都以某种关系从属于支配者。依存句法的结构没有非终结点,词与词之间直接发生依存关系,构成一个依存对,其中一个是核心词,也叫支配词,另一个叫修饰词,也叫从属词。依存关系用一个邮箱弧表示,叫做依存弧。

依存句法分析的五个条件:

(1)一个句子中只有一个成分是独立的

(2)句子的其他成分都从属与某一成分

(3)任何一个成分都不能依存于两个或两个以上的成分

(4)如果成分A直接从属成分B,而成分C在句子中位于A和B之间,那么成分C或者从属于A,或者从属于B,或者从属于A和B之间的某一成分

(5)中心成分左右两边的其他成分相互不发生关系

标注词表(tag)

名词: NN, NNS, NNP, NNPS

代词: PRP, PRPS

形容词: JJ, JJR, JJS

数词: CD

动词: VB, VBD, VBG, VBN,VBP, VBZ

副词: RB, RBR, RBS

1. CC Coordinating conjunction 连接词

2. CD Cardinal number 基数词

3. DT Determiner

限定词(如this,that,these,those,such,不定限定词:no,some,any,each,every,enough,either,neither,all,both,half,several,many,much,(a)

few,(a) little,other,another.

4. EX Existential there 存在句

5. FW Foreign word 外来词

6. IN Preposition or subordinating conjunction 介词或从属连词

7. JJ Adjective 形容词或序数词

8. JJR Adjective, comparative 形容词比较级

9. JJS Adjective, superlative 形容词最高级

10. LS List item marker 列表标示

11. MD Modal 情态助动词

12. NN Noun, singular or mass 常用名词 单数形式

13. NNS Noun, plural 常用名词 复数形式

14. NNP Proper noun, singular 专有名词,单数形式

15. NNPS Proper noun, plural 专有名词,复数形式

16. PDT Predeterminer 前位限定词

17. POS Possessive ending 所有格结束词

18. PRP Personal pronoun 人称代词

19. PRP$ Possessive pronoun 所有格代名词

20. RB Adverb 副词

21. RBR Adverb, comparative 副词比较级

22. RBS Adverb, superlative 副词最高级

23. RP Particle 小品词

24. SYM Symbol 符号

25. TO to 作为介词或不定式格式

26. UH Interjection 感叹词

27. VB Verb, base form 动词基本形式

28. VBD Verb, past tense 动词过去式

29. VBG Verb, gerund or present participle 动名词和现在分词

30. VBN Verb, past participle 过去分词

31. VBP Verb, non-3rd person singular present 动词非第三人称单数

32. VBZ Verb, 3rd person singular present 动词第三人称单数

33. WDT Wh-determiner 限定词(如关系限定词:whose,which.疑问限定词:what,which,whose.)

34. WP Wh-pronoun 代词(who whose which)

35. WP$ Possessive wh-pronoun 所有格代词

36. WRB Wh-adverb 疑问代词(how where when)

关系表示(dep)

abbrev: abbreviation modifier,缩写

acl: 名词从句修饰语

acomp: adjectival complement,形容词的补充;

advcl : adverbial clause modifier,状语从句修饰词

advmod: adverbial modifier状语

agent: agent,代理,一般有by的时候会出现这个

amod: adjectival modifier形容词

appos: appositional modifier,同位词(介词修饰语)

attr: attributive,属性

aux: auxiliary,非主要动词和助词,如BE,HAVE SHOULD/COULD等到

auxpass: passive auxiliary 被动词

case: 格标记

cc: coordination,并列关系,一般取第一个词

ccomp: clausal complement从句补充

complm: complementizer,引导从句的词好重聚中的主要动词

compound: 复合标识符

conj : conjunct,连接两个并列的词。

cop: copula。系动词(如be,seem,appear等),(命题主词与谓词间的)连系

csubj : clausal subject,从主关系

csubjpass: clausal passive subject 主从被动关系

dep: dependent依赖关系

det: determiner决定词,如冠词等

obj: object, 宾语

dobj : direct object直接宾语

expl: expletive,主要是抓取there

infmod: infinitival modifier,动词不定式

iobj : indirect object,非直接宾语,也就是所以的间接宾语;

csubj: 从句主语

csubjpass: 被动从句主语

mark: marker,主要出现在有“that” or “whether”“because”, “when”,

mwe: multi-word expression,多个词的表示

neg: negation modifier否定词

nn: noun compound modifier名词组合形式

nmod: 标称修饰语

npadvmod: noun phrase as adverbial modifier名词作状语

nsubj : nominal subject,名词主语

nsubjpass: passive nominal subject,被动的名词主语

num: numeric modifier,数值修饰

number: element of compound number,组合数字

parataxis: parataxis: parataxis,并列关系

partmod: participial modifier动词形式的修饰

pcomp: prepositional complement,介词补充

pobj : object of a preposition,介词的宾语

poss: possession modifier,所有形式,所有格,所属

possessive: possessive modifier,这个表示所有者和那个’S的关系

preconj : preconjunct,常常是出现在 “either”, “both”, “neither”的情况下

predet: predeterminer,前缀决定,常常是表示所有

prep: prepositional modifier

prepc: prepositional clausal modifier

prt: phrasal verb particle,动词短语

punct: punctuation,这个很少见,但是保留下来了,结果当中不会出现这个

purpcl : purpose clause modifier,目的从句

quantmod: quantifier phrase modifier,数量短语

rcmod: relative clause modifier相关关系

ref : referent,指示物,指代

rel : relative

root: root,最重要的词,从它开始,根节点

tmod: temporal modifier

xcomp: open clausal complement 开放式补语

xsubj : controlling subject 掌控者

nummod: 数词修饰语

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
对于依存句法分析,Python 中有一些流行的库可以使用。其中最常用的是 NLTK(自然语言工具包)和 SpaCy。这两个库提供了依存句法分析的功能。 使用 NLTK 库,你需要先安装 NLTK 并下载相应的数据包。然后可以使用 `nltk.parse` 模块来进行句法分析,其中包括依存句法分析。 下面是一个使用 NLTK 进行依存句法分析的示例代码: ```python import nltk # 下载依存句法分析所需的数据包 nltk.download('punkt') nltk.download('averaged_perceptron_tagger') nltk.download('maxent_ne_chunker') nltk.download('words') nltk.download('treebank') # 创建依存句法解析器 parser = nltk.parse.CoreNLPDependencyParser(url='http://localhost:9000') # 分析句子并打印结果 sentence = "The cat is drinking milk." result = parser.parse(sentence.split()) for parse in result: parse.pretty_print() ``` 如果你想使用 SpaCy 库,你需要先安装 SpaCy 并下载相应的模型。然后可以使用 `spacy` 模块进行依存句法分析。 下面是一个使用 SpaCy 进行依存句法分析的示例代码: ```python import spacy # 加载英文模型 nlp = spacy.load('en_core_web_sm') # 处理文本并获取依存句法树 sentence = "The cat is drinking milk." doc = nlp(sentence) for token in doc: print(token.text, token.dep_, token.head.text, token.head.pos_) ``` 以上就是使用 NLTK 和 SpaCy 进行依存句法分析的简单示例代码。你可以根据自己的需求选择合适的库和模型进行使用。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值