使用句法依存分析实现KBQA中的约束挂载

23 篇文章 4 订阅
9 篇文章 1 订阅

一、约束挂载

本文内容主要讲解通过句法依存实现约束挂载的流程.

1.1 约束词识别

query中的约束词如:

  • 过滤类型:大于、小于、超过、不超过等
  • 最值类型:最大、最小等

从query中识别出这些约束词可以简单的使用词表进行识别,那么识别出这些约束词之后,怎么挂载到相应的位置呢?

1.2 约束挂载

带约束问题是KBQA中常见的复杂问题之一,如:“身高超过1米8的篮球运动员”。约束词为“超过”,在这个例子中需要召回身高超过1米8的篮球运动员,这时候就涉及约束挂载。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-sncLpxc0-1663165134447)(D:\资料\微信公众号\imgs\image-20220908203756585.png)]

二、句法依存进行约束挂载流程

依存句法分析( dependency parsing )指的是分析句子的依存语法的一种中高级 NLP任务,其输人通常是词语和词性,输出则是一棵依存句法树。如下图所示的句法分析图。

对于上述例子使用句法依存实现约束挂载的主要流程为:

  1. 约束词识别:超过
  2. 识别约束词的主语:(身高,SBV,超过)
  3. 识别约束词的宾语:(超过,VOB,8)
  4. 获取所有宾语的ATT并合:[1,米]–>(超过,VOB,1米8)
  5. 约束挂载识别entity_type:(超过,ATT,运动员)
  6. 合并“运动员”的ATT:篮球运动员

对于复杂的情况:如下图:
在这里插入图片描述

则可以通过图中的COO传递相关的依存关系。

附录

依存句法关系表:

+------------+-----+---------------------------+----------------------------+
|  关系类型  | Tag |        Description        |          Example           |
+============+=====+===========================+============================+
| 主谓关系   | SBV | subject-verb              | 我送她一束花 (我 <-- 送)   |
+------------+-----+---------------------------+----------------------------+
| 动宾关系   | VOB | 直接宾语,verb-object     | 我送她一束花 (送 --> 花)   |
+------------+-----+---------------------------+----------------------------+
| 间宾关系   | IOB | 间接宾语,indirect-object | 我送她一束花 (送 --> 她)   |
+------------+-----+---------------------------+----------------------------+
| 前置宾语   | FOB | 前置宾语,fronting-object | 他什么书都读 (书 <-- 读)   |
+------------+-----+---------------------------+----------------------------+
| 兼语       | DBL | double                    | 他请我吃饭 (请 --> 我)     |
+------------+-----+---------------------------+----------------------------+
| 定中关系   | ATT | attribute                 | 红苹果 (红 <-- 苹果)       |
+------------+-----+---------------------------+----------------------------+
| 状中结构   | ADV | adverbial                 | 非常美丽 (非常 <-- 美丽)   |
+------------+-----+---------------------------+----------------------------+
| 动补结构   | CMP | complement                | 做完了作业 (做 --> 完)     |
+------------+-----+---------------------------+----------------------------+
| 并列关系   | COO | coordinate                | 大山和大海 (大山 --> 大海) |
+------------+-----+---------------------------+----------------------------+
| 介宾关系   | POB | preposition-object        | 在贸易区内 (在 --> 内)     |
+------------+-----+---------------------------+----------------------------+
| 左附加关系 | LAD | left adjunct              | 大山和大海 (和 <-- 大海)   |
+------------+-----+---------------------------+----------------------------+
| 右附加关系 | RAD | right adjunct             | 孩子们 (孩子 --> 们)       |
+------------+-----+---------------------------+----------------------------+
| 独立结构   | IS  | independent structure     | 两个单句在结构上彼此独立   |
+------------+-----+---------------------------+----------------------------+
| 核心关系   | HED | head                      | 指整个句子的核心           |
+------------+-----+---------------------------+----------------------------+
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值