任务:句法分析(syntactic parsing)的任务就是识别句子的句法结构(syntactic structure)。
类型:
短语结构分析(Phrase parsing)
- 完全句法分析(Full parsing)
- 局部句法分析(Partial parsing)
依存句法分析(Dependency parsing)
短语结构分析
目标:实现高正确率、高鲁棒性(robustness)、高速度的自动句法分析过程。
困难:自然语言中存在大量的复杂的结构歧义(structural ambiguity)。
线图分析法
三种策略
- 自底向上(Bottom-up)
- 从上到下(Top-down)
- 从上到下和从下到上结合
CYK分析算法
优点:简单易行,执行效率高
弱点:必须对文法进行范式化处理、无法区分歧义
概率上下文无关文法
PCFG的三个问题
- 内向算法或外向算法解决第一个问题,即快速地计算句子的句法树概率
- Viterbi算法解决第二个问题,即最佳分析结果搜索
- 内外向算法解决第三个问题,即参数估计
PCFG的评价
优点:
- 可利用概率减少分析过程的搜索空间;
- 可利用概率对概率较小的子树剪枝,加快分析效率;
- 可以定量地比较两个语法的性能。
弱点:
- 分析树的概率计算条件非常苛刻,甚至不够合理。
短语结构分析方法评估