NLP中的树结构
树结构的分类
NLP中常见的树结构有两种,一种是Dependency Tree即依存树,另一种是Constituency Tree(即短语结构树,为了提高准确率,Constituency Tree往往以二叉形式给出)。
下面是几个简单的例子(图片来自网络):
Constituency Tree
Constituency Tree(二叉形式)
Dependency Tree
树结构解析格式的分类
树结构解析最常用的工具是Stanford Parser(Stanford NLP)。
树结构解析的结果格式多样,但是万变不离其宗,大体有以下几种格式:
1.标注边
多见于依存树,除了标注边之外,还可以对边标注关系。以上面例子中的句子为例,可以描述为:
(ROOT,喜欢)
(喜欢,猴子)