nlp一直致力于:描述人类语言结构
两个主要的方法:1.上下文无关文法
依存关系:
用依存关系来看什么东西解释了什么东西
ambiguity
句法:找到一条规则可以生成无数句子
依存树库优点:
1.可以反复使用,但是人类语法却几乎不可重复使用,因为每个人书写的语法规则不一样
2.更易找到不同人的书写规则
3.对于机器学习,它可以给出所有可能性及其各自的频率
Dependency grammar(依存语法)
箭头即为依存
Dependency Parsing
把句子中每个词提出来,然后判断这些词的独立项或者头部是什么。一般需要满足两个条件:
1.一个词最多一个独立项
2.无环
从而生成依存树
(1)投影依存树
:存在嵌套
(nesting),一般句子均存在嵌套
如果不在意句子的线性顺序,画出来仍然是树,只有当在意句子前后顺序时,才会考虑嵌套,即投影性
(2)非投影依存树:无嵌套
注意:无法从依存树还原出一个句子,树没有句子顺序
Methods of Dependency Parsing
1.动态编程
2.图,MST算法生成最小生成树
3.约束满足关系
4.基于转化的句法分析。使用贪心考虑每个词