句法树
我们把一个句子构建成语法树(CKY算法构建)
NP:名词短语
P:介词
PP:介词短语
V:动词
N:名词
内部节点都是可以拆分的,叶子节点不可以拆分
从句法树中提取特征
除了一般的特征工程之外,还可以从里面提取一些特征。
- 我们面对的是一棵树,所以我们可以提取最大路径
- 再比如我们关注的点在Microsoft上,我们也可以挖掘一些从S->Microsoft的路径
往往这些特征承担的重要性不大,而且句法特征起到的作用很小,但是当我们处理很短的句子的时候,我们可以提取的特征是十分有限的,这时可以加入一下句法特征。