1、句法分析
(1)主要任务:识别出句子所包含的的句法成分以及这些成分之间的关系,一般以句法树来表示句法分析的结果。
(2)难点:歧义;搜索空间
(3)句法分析种类:
①完全句法分析:以获取整个句子的句法结构为目的
②局部句法分析:只关注局部的一些成分,例如依存句法分析
(4)句法分析方法:基于规则(存在语法规则覆盖有限、系统可迁移差等缺陷);基于统计(一套面向候选树的评价方法,其会给正确的句法树赋予一个较高的分值,而给不合理的句法树赋予一个较低的分值)
2、句法分析的数据集与评测方法
(1)句法分析的数据集
中文树库有中文宾州树库(CTB)、清华树库(TCT)、台湾中研院树库。其中CTB是目前绝大多数的中文句法分析研究的基准语料库。不同的树库有着不同的标记体系,使用时切记使用一种树库的句法分析器,然后用其它树库的标记体系来解释。
(2)句法分析的评测方法
①主要任务:测评句法分析器生成的树结构与手工标注的树结构之间的相似程度。主要考虑两方面的性能:满意度和效率。满意度是指测试句法分析器是否合适或胜任某个特定的nlp处理任务&#