CS224n-06 Dependency Parsing

该博客深入探讨了依存句法分析,从语言结构的两种观点、歧义问题到Universal Dependencies treebanks。讨论了依赖语法、依赖结构及其在解析中的应用,介绍了词嵌入如何提升分布相似度。进一步讲解了贪婪转换基解析,包括基本的、弧标准的转换基解析器和MaltParser。此外,还涉及特征表示、评价标准和句法分析的未来趋势,特别是神经网络在句法解析中的作用。
摘要由CSDN通过智能技术生成

06 Dependency Parsing

课程计划

1、语法结构:一致性和依赖性。
2、依存语法。
3、研究亮点
4、基于转换的句法依存关系分析(Transition-based dependency parsing)
5、神经网络句法依存分析

1、语言结构的两种观点(Constituency = phrase structure grammar = context-free grammars (CFGs))

句法结构将单词组织成嵌套的成分


依存关系结构表示一个单词依赖于周围的哪一个词。

歧义(Ambiguity: PP attachments)

通过句法树可以表达歧义,一个确定的句法树对应句子的一个确定解读。from space这个介词短语到底依附谁?不同的答案导致对句子不同的理解。

依附歧义(Attachment ambiguities)

关键的语法决策是如何把一个短语 (介词短语、状语短语、分词短语、不定式) 依附到其他成分上去,比如下列句子:


数据标注的起源:Universal Dependencies treebanks

[Universal Dependencies: http://universaldependencies.org/ ;
cf. Marcus et al. 1993, The Penn Treebank, Computational Linguistics]

人们偏好树库多于规则的原因是显而易见的,树库虽然标注难度高,但每一份劳动都可被复用(可以用于词性标注命名实体识别等等任务);而每个人编写的规则都不同,并且死板又丑陋。树库的多用性还是得其作为评测的标杆数据,得到了越来越多的引用。

2. 依存语法和依存结构(Dependency Grammar and Dependency Structure)

依存语法假设语法结构包含词汇和一般的二元不对称关系被叫做依赖性。
标注依存弧label的依存句法树就是短语结构树的一种:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值
>