进行统计自然语言处理系统梳理,学习资料《统计自然语言处理.宗成庆》。
一、概述
句法分析是自然语言处理技术中的关键技术之一,其基本任务是确定句子的句法结构或句子中词汇之间的依存关系。
句法分析分为句法结构分析和依存关系分析。
句法结构分析又称成分结构分析或短语结构分析,其又分为二种。以获取整个句子的句法结构为目的分析称为完全句法分析或完全短语结构分析。以获得局部成分(如基本名词短语)为目的的分析称为局部分析或浅层分析。
依存关系分析又称为依存句法分析或依存结构分析。
二、句法结构分析
2.1句法分析概述
句法分析是指对输入的单词序列判断其构成是否合乎给定的语法,分析出合乎语法的兔子的句法结构。句法结构一般用树状数据结构表示,通常称为句法分析树。
句法结构分析一般有三个任务:1,判断输入的字符串是否属于某种语言;2,消除句子中的词法和结构方面的歧义;3,分析句子内部结构,如成分构成,上下文关系。
句法分析一般需要考虑三个方面的工作:语法的形式化表示,词条信息的描述,分析算法的设计。其中语法的形式化表示着重了解上下文无关方法。
句法分析方法可以简单分析基于规则和基于统计的。
句法分析树的形成方法可以分为三类:自顶向下,自底向上,二者结合。
2.2完全句法分析
主要是了解基于概率的上下文无关文法分析。</