一、约束挂载
本文内容主要讲解通过句法依存实现约束挂载的流程.
1.1 约束词识别
query中的约束词如:
- 过滤类型:大于、小于、超过、不超过等
- 最值类型:最大、最小等
- …
从query中识别出这些约束词可以简单的使用词表进行识别,那么识别出这些约束词之后,怎么挂载到相应的位置呢?
1.2 约束挂载
带约束问题是KBQA中常见的复杂问题之一,如:“身高超过1米8的篮球运动员”。约束词为“超过”,在这个例子中需要召回身高超过1米8的篮球运动员,这时候就涉及约束挂载。
二、句法依存进行约束挂载流程
依存句法分析( dependency parsing )指的是分析句子的依存语法的一种中高级 NLP任务,其输人通常是词语和词性,输出则是一棵依存句法树。如下图所示的句法分析图。
对于上述例子使用句法依存实现约束挂载的主要流程为:
- 约束词识别:超过
- 识别约束词的主语:(身高,SBV,超过)
- 识别约束词的宾语:(超过,VOB,8)
- 获取所有宾语的ATT并合:[1,米]–>(超过,VOB,1米8)
- 约束挂载识别entity_type:(超过,ATT,运动员)
- 合并“运动员”的ATT:篮球运动员
对于复杂的情况:如下图:
则可以通过图中的COO边传递相关的依存关系。
附录
依存句法关系表:
+------------+-----+---------------------------+----------------------------+
| 关系类型 | Tag | Description | Example |
+============+=====+===========================+============================+
| 主谓关系 | SBV | subject-verb | 我送她一束花 (我 <-- 送) |
+------------+-----+---------------------------+----------------------------+
| 动宾关系 | VOB | 直接宾语,verb-object | 我送她一束花 (送 --> 花) |
+------------+-----+---------------------------+----------------------------+
| 间宾关系 | IOB | 间接宾语,indirect-object | 我送她一束花 (送 --> 她) |
+------------+-----+---------------------------+----------------------------+
| 前置宾语 | FOB | 前置宾语,fronting-object | 他什么书都读 (书 <-- 读) |
+------------+-----+---------------------------+----------------------------+
| 兼语 | DBL | double | 他请我吃饭 (请 --> 我) |
+------------+-----+---------------------------+----------------------------+
| 定中关系 | ATT | attribute | 红苹果 (红 <-- 苹果) |
+------------+-----+---------------------------+----------------------------+
| 状中结构 | ADV | adverbial | 非常美丽 (非常 <-- 美丽) |
+------------+-----+---------------------------+----------------------------+
| 动补结构 | CMP | complement | 做完了作业 (做 --> 完) |
+------------+-----+---------------------------+----------------------------+
| 并列关系 | COO | coordinate | 大山和大海 (大山 --> 大海) |
+------------+-----+---------------------------+----------------------------+
| 介宾关系 | POB | preposition-object | 在贸易区内 (在 --> 内) |
+------------+-----+---------------------------+----------------------------+
| 左附加关系 | LAD | left adjunct | 大山和大海 (和 <-- 大海) |
+------------+-----+---------------------------+----------------------------+
| 右附加关系 | RAD | right adjunct | 孩子们 (孩子 --> 们) |
+------------+-----+---------------------------+----------------------------+
| 独立结构 | IS | independent structure | 两个单句在结构上彼此独立 |
+------------+-----+---------------------------+----------------------------+
| 核心关系 | HED | head | 指整个句子的核心 |
+------------+-----+---------------------------+----------------------------+