一、 Why句法分析
句法分析是比词高一个层级的语言单位,单个词之间通过中文语法规则进行组织,形成一个具有连贯语义的词语序列。为了揭示这种组织结构和规则,揭示出词语以及词语的成分,往往需要对其进行句法分析。就中文而言,句子有七个成分,分别为主语、谓语、宾语、补语、定语、状语、同位语。 主语是一个句子的发生动作的主体,谓语是一般是动词充当,宾语是表示动作发生的对象。基于句法分析,可以实现对句子作成分功能或作用进行分析,从而标记出基本成分(主语、谓语、宾语)和次要成分(状语、补语)。
二、 句法分析的类型
句法分析,分成两种,一种是句子结构分析(syntactic structure parsing)和依存句法分析(dependency parsing)。其中句法结构分析又称为句法分析、短语句法分析。依存句法分析分为依存句法分析和语义依存分析两类。
2.1句子结构分析
本质上将句子视作为嵌套的短语组合。句法结构分析主要目的是解析整个句子的句法组织结构以及短语层级结构,属于一种层次性的分析方式。
a, 句子成分分析,standfordparser
2.2 依存句法分析
依存句法分析则通常通过依存弧对句子中的词语进行连接,用于标识词语之间的依存关系,从而形成整个句子的句法关系依存树。依存句法分析中的依存弧可以形式化成一个三元组,即<核心词(被修饰词),依存关系,修饰词>,依存弧是有有向的,通常由修饰词指向被修饰词。同时满足三个约束,即单核心约束,即句子中的每个