python 语义依存分析_CS224N NLP with Deep Learning(五):依存分析

本文探讨了依存分析在解决自然语言处理中的歧义问题上的作用,通过对比短语结构文法和依存结构,重点介绍了依存结构。文章详细阐述了依存句法的定义、特性,并提到了基于转移和图的依存分析器,以及神经网络在依存分析中的应用。最后,讨论了模型评估方法和相关阅读资源。
摘要由CSDN通过智能技术生成

1238239f26ce342e1d52cc749eb1b79e.png

在文章开始前,我先啰嗦两句。有细心的同学可能发现了之前的文章已经更新到了第五讲,那么这篇怎么又是第五讲呢?这是因为在我拖更(划掉)的这段时间里,这门课程更新到了2019版,课程结构做了一些调整,因此这篇文章以及之后的文章都会按照2019版的课程内容写作,而之前的文章我会尽快(我也不知道什么时候)更新到与新版一致。

5afa49fbb7b438ce77ec4f7460386a3b.png

在开始讲依存分析(Dependency Parsing)之前,我们先来看一个例子。考虑“Scientists count whales from space”这句话,这句话有着明显的歧义,即可以理解为“科学家从宇宙中数鲸鱼”,也可理解为“科学家数来自宇宙的鲸鱼”。在日常生活中歧义的例子也不胜枚举,产生原因也多种多样。而这句话出现歧义主要是介词短语(Prepositional Phrase, PP)“from speace”修饰的对象不明导致的。此外还存在同位语范围不明(coordination scope ambiguity)、形容词修饰对象不明(adjectival modifier ambiguity)、动词短语修饰对象不明(Verb Phrase attachment ambiguity)等多种歧义,课程中举了很多例子,在此就不详细描述了。尽管歧义经常出现,但是人类可以判断出句子可能表达的多种含义,但让计算机去理解就非常困难了。这时我们就自然地会想,人是怎么理解这些句子的呢?计算机能不能模仿人类去理解这些句子呢?为了研究这些问题,我们就需要考虑语句结构(sentence structure)。

语句结构可以由两种方式看待:

  1. 短语结构文法(constituency structure 或 phrase structure grammer):更具体地说,短语结构文法通常指上下文无关文法(context-free grammars, CFGs)。这种方式将句子看作由多个短语的组合,而短语即可由多个单词组成,也可由单词和短语或是多个短语组成。例如冠词(+形容词)+名词构成名词短语(the cat, a barking dog),介词+名词短语可以构成介词短语(in a crate, on the table, by the green door),同时冠词(+形容词)+名词+介词短语又可以构成名词短语(the cat by the door)。这样我们可以写出很多的短语结构,它们也可以递归地形成更长的短语,最终构成语法来描述语言。
  2. 依存结构(dependency structure):这种方式采用了一个更简洁的视角看问题,即考虑某个单词依赖于哪个单词?例如“Look for the large barking dog by the door in a crate”中的依存结构可以用下图表示

6b150967d182ac0f93f0ee07e9e925ca.png

其中“Look”的对象是“dog”,因此可以认为“dog”依赖于“Look”;而“large”和“barking”都是形容“dog”的,因此也认为这两个词依赖于“dog”,除此之外句子中的介词例如“for”、“the”也存在相应的依存关系。

上下文无关文法并不擅长处理歧义,因此也常用于精心构造、没有歧义的编程语言描述。之后的章节会更详细的讲解上下文无关文法,本章我们先关注依存结构。


依存结构

依存句法(dependency syntax)假设语句通常由二元非对称的单词关系(如上文图中所示的箭头)组成,称为依存(dependencies)。依存可以有多种种类,以表示不同的语义关系,例如主语(subject)、介词宾语(prepositional object)、同位语(apposition)等。由于不同的学者有不同偏好,所以在依存分析发展的过程中,出现了两种表示依存的方式,一种是由核心词(head, or governor, superior, regent)指向依存词(dependent, or modifier, inferior, subordinate),而另一种则恰恰相反。在本课程中,我们使用第一种方式表示依存,这也是比较常用的一种方式。一般情况下,依存关系可以形成一颗树(单向、无环),例如

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值