NLP工具——Stanza依存关系含义详解

最新推荐文章于 2024-03-04 19:39:49 发布

常鸿宇

最新推荐文章于 2024-03-04 19:39:49 发布

阅读量1.1w

点赞数 32

分类专栏：自然语言处理文章标签：自然语言处理人工智能 nlp

本文链接：https://blog.csdn.net/weixin_44826203/article/details/121253732

版权

自然语言处理专栏收录该内容

50 篇文章 72 订阅

订阅专栏

NLP工具——Stanza依存关系含义详解

1. 概要
2. 详细介绍
3. 速查表

1. 概要

stanza工具是一个基于python的NLP工具，这篇博客主要介绍依存关系中各种关系的含义，如果要了解这个工具的话可以参考其他文章，比如我朋友的这一篇：
https://blog.csdn.net/GodDavide/article/details/105539730

但是我发现他博客中对句法结构关系的介绍是coreNLP的，而非stanza的，所以写这篇博客纠正一下。原网站还挺难找的，并不是在stanza的官网上介绍的，而是引用了另一个工具的帮助文档。

想迅速查找某个依存关系含义的同学可以直接看本文的第三部分，或点击目录快速跳转。

我把这个帮助文档的相关链接也贴出来，中文不好的同学可以直接去看原文档：
https://universaldependencies.org/u/dep/index.html

2. 详细介绍

所有的依存关系可以分为狭义依存和广义依存关系，其中，广义依存关系又可以分为核心论元（Core arguments），非核心依存（Non-core dependents）以及名义依存（Nominal dependents）。

下图中，上半部分是狭义依存关系，下半部分是不包含在狭义概念中的依存关系。

上半表中，纵列为依存的目录分类，依次为名词性（Nominals）、从句（Clauses）、修饰词（Modifier words），以及虚词（Function Words）。下面将对上半表的内容进行详细介绍。

2.1 核心论元

2.1.1 nsubj: nominal subject（名词主语）

名词主语（nsubj）是一个名词，它是句法结构主语，是从句的原型节点（这里的描述均为机翻＋人工纠正）。被动语态下的特殊名词主语，被记作 nsubj:pass。直接看文档中给出的例子：
nsubj

2.1.2 obj: object（宾语）

动词的宾语是动词中仅次于主语的第二大核心论元。
obj

2.1.3 iobj: indirect object（间接宾语）

动词的间接宾语是任何作为动词核心论元的名词短语，但不是其主语或（直接）宾语。
iobj
但是，如果只有一个宾语存在，则不论语义分析的结果如何，都会被标记为obj，而非iobj。
iobj1

2.1.4 csubj: clausal subject（从句主语）

从句主语是一个从句的从句句法主语，即主语本身就是一个从句。
csubj

2.1.5 ccomp: clausal complement（从句补足语）

动词或形容词的从句补语是一个从属从句，它是一个核心论元。

ccomp

2.1.6 xcomp: open clausal complement（开放从句补足语）

动词或形容词的开放从句补足语（xcomp）是没有主语的谓语或从句补足语。
xcomp
关于ccomp和xcomp的区别，可以看下图，主要在于是否可以将主句和从句完全切分开，前句的boss不一定执行了digging，而后句的we必然是digging的执行者。
xccomp

2.2 非核心依存

2.2.1 obl: oblique nominal（间接名词）

obl是作为名词（名词、代词、名词短语）非核心的论元附属结构。
obl
obl2
当指向被动语态的agent时，记作obl:agent：
obla

2.2.2 vocative: vocative（呼格词）

称呼关系用于标记语篇中的对话参与者。
voc

2.2.3 expl: expletive（感叹词）

不知道怎么翻译合适。看例子：
expl·
expl

2.2.4 dislocated: dislocated elements（错位元素）

错位关系用于不符合句子通常核心语法关系的前置或后置元素。
disloc

2.2.5 advcl: adverbial clause modifier（状语从句修饰语）

状语从句修饰语是修饰动词或其他谓语（形容词等）的从句，作为修饰语而不是核心补语。
advcl

2.2.6 advmod: adverbial modifier（状语修饰语）

一个词的状语修饰语是修饰谓语或修饰词的非从句状语或状语短语。
advmod

2.2.7 discourse: discourse element（语素）

这用于感叹词和其他话语粒子和元素（除了表达方式外，与句子结构没有明确联系）。
discourse

2.2.8 aux: auxiliary（辅助词）

从句的辅助词是一个虚词，与表示时态、语气、语态或证据性等类别的动词谓词有关。
aux

2.2.9 cop: copula（连接词）

连接词是一个虚词与非言语谓词之间的关系，包括身份谓词的表达（例如，“Kim是总统”之类的句子）。
cop

2.2.10 mark: marker（标记词）

标记词是将一个从句标记为从属于另一个从句的词。
marker

2.3 名义依存

2.3.1 nmod: nominal modifier（名词修饰语）

nmod关系用于另一个名词或名词短语的名词性从属词，在功能上对应于属性或属格补语。
nmod

2.3.2 appos: appositional modifier（同位语修饰语）

名词的同位语修饰语是紧跟在第一个名词之后的名词，用来定义、修饰、命名或描述该名词。
appos

2.3.3 nummod: numeric modifier（数字修饰语）

名词的数字修饰语是用数量修饰名词含义的任何数字短语。
num
但是如果不是确定的数字，则会被标记为det：
det

2.3.4 acl: clausal modifier of noun （名词的从句修饰语）

acl表示一个名词的从句修饰语。
acl
acl2

2.3.5 amod: adjectival modifier（形容词修饰语）

名词（或代词）的形容词修饰语是用来修饰名词（或代词）的任何形容词组。
amod

2.3.6 det: determiner（限定词）

关系限定词（det）在名词与其限定词之间起作用。
det1

2.3.7 clf: classifier（分类词）

英语中不会出现这类词。
cls

2.3.8 case: case marking（格位标记）

case

2.4 广义依存关系

2.4.1 conj: conjunct（连词）

连词可以用来连接并列的名词，或并列的动词：
conj
conj3
conj2

2.4.2 cc: coordinating conjunction（协调连词）

cc是连接词和前面的协调连接词之间的关系。
例子见2.4.1中第2个例子，也就是and。

2.4.3 fixed: fixed multiword expression（固定多字表达式）

固定关系是多词表达式（MWE）的三种关系之一（其他两种是扁平和复合关系）。
fix

2.4.4 flat: flat multiword expression（扁平多字表达式）

是多词表达式的一种。
用于名称：
flat
flat2
flat3
用于复杂数字和日期：
flat4
flat5
用于外来词汇：
flat6

2.4.5 compound: compound（复合表达式）

compound

2.4.6 list: list（列表关系）

列表关系用于可比较项目的链。
list1

list2 list3

2.4.7 parataxis: parataxis（无连词并列）

意合关系（源自希腊语的“并排放置”）是一个词（通常是句子的主要谓语）与其他元素之间的关系，如句子插入语或“：”或“；”后的从句，并排放置，与主词没有任何明确的协调、从属或论证关系。

这个有些复杂没太搞明白，建议看原文档的介绍。

para

2.4.8 orphan: orphan（孤立词）

孤立关系用于头部省略的情况。如下例子中，Peter和bronze之间的won省略了。
orph

2.4.9 goeswith: goes with（配合词）

这种关系将单词的两个或多个部分链接在未经过良好编辑的文本中。

这个像是把分开了的子词纠正回一个完整的词。
goes

2.4.10 reparandum: overridden disfluency（重复非流畅）

over

2.4.11 other（其他）

root（根节点）：
root
punctuation（标点）：
punct
unspecified dependency（非确定依存）：
dep

3. 速查表

所有依存关系按照英文字母排序如下：

简写	全称	中文含义（部分机翻）
acl	clausal modifier of noun (adnominal clause)	名词的从句修饰语
acl:relcl	relative clause modifier	关系从句修饰语
advcl	adverbial clause modifier	状语从句修饰语
advmod	adverbial modifier	状语修饰语
advmod:emph	emphasizing word, intensifier	强调词、加强词
advmod:lmod	locative adverbial modifier	位置状语修饰语
amod	adjectival modifier	形容词修饰语
appos	appositional modifier	同位语修饰语
aux	auxiliary	辅助词
aux:pass	passive auxiliary	被动助词
case	case marking	格位标记
cc	coordinating conjunction	协调连词
cc:preconj	preconjunct	前连词
ccomp	clausal complement	从句补足语
clf	classifier	分类词
compound	compound	复合表达式
compound:lvc	light verb construction	轻动词结构
compound:prt	phrasal verb particle	短语动词助词
compound:redup	reduplicated compounds	重叠复合词
compound:svc	serial verb compounds	连动复合词
conj	conjunct	连词
cop	copula	系动词
csubj	clausal subject	从句主语
csubj:pass	clausal passive subject	从句被动主语
dep	unspecified dependency	非确定依存
det	determiner	限定词
det:numgov	pronominal quantifier governing the case of the noun	支配名词格的代词量词
det:nummod	pronominal quantifier agreeing in case with the noun	与名词一致的代词量词
det:poss	possessive determiner	物主限定词
discourse	discourse element	语素
dislocated	dislocated elements	错位元素
expl	expletive	感叹词
expl:impers	impersonal expletive	非人称感叹词
expl:pass	reflexive pronoun used in reflexive passive	反身被动语态中的反身代词
expl:pv	reflexive clitic with an inherently reflexive verb	带有固有反身动词的反身代词
fixed	fixed multiword expression	固定多字表达式
flat	flat multiword expression	扁平多字表达式
flat:foreign	foreign words	外来词扁平多字表达式
flat:name	names	名称扁平多字表达式
goeswith	goes with	配合词
iobj	indirect object	间接宾语
list	list	列表关系
mark	marker	标记
nmod	nominal modifier	名词修饰语
nmod:poss	possessive nominal modifier	所有格名词修饰语
nmod:tmod	temporal modifier	时间修饰
nsubj	nominal subject	名词主语
nsubj:pass	passive nominal subject	被动名词主语
nummod	numeric modifier	数字修饰符
nummod:gov	numeric modifier governing the case of the noun	控制名词大小写的数字修饰语
obj	object	宾语
obl	oblique nominal	间接名词
obl:agent	agent modifier	间接名词，被动语态的发出者
obl:arg	oblique argument	间接名词论元
obl:lmod	locative modifier	间接名词，位置修饰语
obl:tmod	temporal modifier	间接名词，时间修饰语
orphan	orphan	孤立词
parataxis	parataxis	无连词并列
punct	punctuation	标点
reparandum	overridden disfluency	重复非流畅
root	root	根节点
vocative	vocative	呼格词
xcomp	open clausal complement	开放从句补足语