CS224n这门课涉及的知识点是很全面的,对于之前一直研究机器翻译的我来说没有接触过句法分析这方面的知识,所以这节课可以带我弥补知识的漏洞。当然想要深入了解句法分析光看视频也是没用的,只能算是一个入门。这篇博客我会介绍在学习句法分析时的初步理解。以及在下一篇博客中我会对 Neural Transition-Based Dependency Parsing 基于神经网络的依存句法解析算法及代码进行梳理。
1、陌生词汇
首先对于语言中有很多陌生的英文词汇,这里先总结一下。
- Syntax: 句法
- Dependency parsing: 依存分析
- Linguistic: 语言
- Context-free grammars(CFGs): 上下文无关语法规则
2、句法分析的两种类型
句法分析是自然语言处理(natural language processing, NLP)中的关键底层技术之一,其基本任务是确定句子的句法结构或者句子中词汇之间的依存关系。句法分析分为句法结构分析(syntactic structure parsing)和依存关系分析(dependency parsing)。
以获取整个句子的句法结构或者完全短语结构为目的的句法分析,被称为成分结构分析(constituent structure parsing)或者短语结构分析(phrase structure parsing)。这种短语语法用固定数量的rule分解句子为短语和单词、分解短语为更短的短语或单词。句法结构树示例如下图所示: