06 Dependency Parsing
课程计划
1、语法结构:一致性和依赖性。
2、依存语法。
3、研究亮点
4、基于转换的句法依存关系分析(Transition-based dependency parsing)
5、神经网络句法依存分析
1、语言结构的两种观点(Constituency = phrase structure grammar = context-free grammars (CFGs))
句法结构将单词组织成嵌套的成分
依存关系结构表示一个单词依赖于周围的哪一个词。
歧义(Ambiguity: PP attachments)
通过句法树可以表达歧义,一个确定的句法树对应句子的一个确定解读。from space这个介词短语到底依附谁?不同的答案导致对句子不同的理解。
依附歧义(Attachment ambiguities)
关键的语法决策是如何把一个短语
(介词短语、状语短语、分词短语、不定式)
依附到其他成分上去,比如下列句子:
数据标注的起源:Universal Dependencies treebanks
[Universal Dependencies: http://universaldependencies.org/ ;
cf. Marcus et al. 1993, The Penn Treebank, Computational Linguistics]
cf. Marcus et al. 1993, The Penn Treebank, Computational Linguistics]
人们偏好树库多于规则的原因是显而易见的,树库虽然标注难度高,但每一份劳动都可被复用(可以用于词性标注命名实体识别等等任务);而每个人编写的规则都不同,并且死板又丑陋。树库的多用性还是得其作为评测的标杆数据,得到了越来越多的引用。
2. 依存语法和依存结构(Dependency Grammar and Dependency Structure)
依存语法假设语法结构包含词汇和一般的二元不对称关系被叫做依赖性。
标注依存弧label的依存句法树就是短语结构树的一种:

该博客深入探讨了依存句法分析,从语言结构的两种观点、歧义问题到Universal Dependencies treebanks。讨论了依赖语法、依赖结构及其在解析中的应用,介绍了词嵌入如何提升分布相似度。进一步讲解了贪婪转换基解析,包括基本的、弧标准的转换基解析器和MaltParser。此外,还涉及特征表示、评价标准和句法分析的未来趋势,特别是神经网络在句法解析中的作用。
最低0.47元/天 解锁文章
1269

被折叠的 条评论
为什么被折叠?



