A Semantics-aware Transformer Model of Relation Linkingfor Knowledge Base Question Answering

关系链接的语义感知转换器模型知识库问答

关系链接是一个重要的组成部分知识库问答系统。 现有系统使用多种启发式,或多个系统的集合,严重依赖表面问题文本。然而,显式语义解析问题是未被利用的关系信息的丰富来源。 我们提出了一个简单的基于transformer的神经模型用于利用句子的 AMR 语义解析的关系链接。 我们的系统在 4流行的基准数据集。 这些是基于在 DBpedia 或 Wikidata 上,展示我们的方法在 KG 中是有效的。 

我们提出了 SemReL; 一个关系链接的语义感知神经模型。SemReL 将注释的问题文本作为输入
及其 AMR 解析和实体信息以及输出关系的排序列表。 这项工作的主要贡献如下: (a) 一个简单的,用于知识库上的关系链接的知识图不可知神经模型,(b)利用AMR 解析以获得更好的问题表示,以及(c) 使用四个数据集的实验评估基于我们展示的 DBpedia 和 Wikidata SemReL 在所有数据集上始终优于现有系统。

2 语义感知关系链接
我们提出了一个关系链接系统,该系统利用从底层知识库中检索相关关系的句子的语义结构。
我们假设语义表示从词汇形式中抽象出来,提供在训练示例中比表面文本更一致的结构线索。 为此,我们使用句子的 AMR 图作为其语义结构。 AMR 是有向无环图用一句话来捕捉谁对谁做什么。 图中的节点是概念和边标有这些概念之间的关系
。 图 1 显示了示例 AMR 图问题“谁建立了帕特·文森特所在的城市死了吗?”。 请注意,问题的 AMR 图将查询的目标表示为特殊节点标记为“amr-unknown”。

 它的 AMR 图和问题中标记和链接的实体(We use the stack transformer parser of Astudillo et al. (2020); Lee et al. (2020) for generating AMR graphs and the BLINK system of Wu et al. (2019) for entity linking.

)。 关系链接分两步执行。 首先,我们的系统在句子和 AMR 图中识别预期关系的数量及其位置。 接下来,对于每个识别出的槽,最可能的关系是使用基于变换器的神经模型预测的,该模型使用来自 KG 的英文标签对它们进行排名。句子的 AMR 结构在这两个步骤中都至关重要。 图2显示了整个系统的示意图。 在下面,我们首先解释使用查找潜在关系槽的过程AMR 图。 接下来我们详细描述我们的关系链接模块。

2.1 关系槽预测
AMR 显式标记命名实体节点(参见图 1)。 这些节点使用 BLINK 实体链接器链接到知识库实体。 图中的实体节点也用于预测数量
和关系槽的位置。 槽被定义为 AMR 图中的
一对节点,其中对应的实体在问题上下文中的知识库中具有关系。 例如,
在图 3 中,节点 city 和 person 涉及与此问题相关的 KB 关系死亡地点。 时隙预测是使用 (Kapa nipathi et al., 2021) 中描述的基于确定性规则的转换完成的。 特别是,我们使用他们基于路径的方法,其中 amr-unknown 节点和链接实体节点之间的所有路径
被检索。 然后,沿路径由谓词节点连接的所有节点对都被视为一个关系槽。

2.2 神经关系链接模型
SemReL 采用 Siamese 网络,其中输入问题和目标关系嵌入在相同的向量空间中。 最可能的关系是表示最接近的关系 的输入问题。 图 3 显示了我们模型的整体架构。 我们使用 Transformer 模型 (Vaswani et al., 2017) 作为输入问题和候选关系的共享编码器。 特别是,我们使用预训练的 BERT 模型(Devlin 等人,2018 年)来初始化编码器参数。 输出向量对应到起始 [CLS] 标记用作输入的向量表示。 该向量通过一个前馈线性层,将其投影到共享嵌入空间。 与Transformer不同参数,顶部线性投影层的权重在问题和关系之间不共享。

语义信息作为输入到编码器的问题的一部分给出。如上所述,在预处理步骤中,识别 AMR 图中的节点对以进行关系链接。例如,在图 3 中,节点“person”和“city”在输入图中被标记为潜在关系的参与者。连接这些节点的子图以自顶向下的方式遍历到形成线性化表示;在这种情况下,它将产生线性化的字符串“die :ARG1 person :location city”。请注意,节点“die-01”的感知标签被删除。此外,所有反向 AMR带有 -of 后缀的关系被规范化为其原始关系名称和方向。在这个例子中 :location-of 被映射到 :location ,方向相反。我们在这个线性化 AMR 路径前面加上输入问题文本的字符串以及特殊的前导标记 [AMR]。问题文本也以特殊的前导标记 [TEXT] 开头。与 AMR 子图的根对齐的单词是标记为 predicate2 ,使用特殊的开始和结束谓词标记 [SP] 和 [EP]。图 3 显示了进入问题编码器的示例问题的完整输入。相同的转换器模型也用作关系编码器。关系名称使用 BERT 分词器进行分词,无需任何额外的预处理。我们将特殊标记 [AMR]、[TEXT]、[SP] 和 [EP] 以及 AMR 关系标签添加到 BERT 词汇表中

训练目标:在训练期间,计算黄金关系的分数以及一组基于他们的向量与问题的向量的内积。 对于向量表示为 ri 的关系 ri 和向量表示为 qn 的问题 qn,得分为 s(ri, qn) = ri.qn。 训练目标是最小化 one-hot gold 真理和预测分数向量之间的交叉熵损失: 

推理:在推理过程中,我们使用 s(r, q) 来表示
得分和排名关系。 由于模型参数保持不变,我们只计算一次所有关系的关系表示。 如果可以从实体分析中获得候选 KB 关系,我们
从该集合中选择排名最高的关系。 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
1. 智慧社区背景与挑战 随着城市化的快速发展,社区面临健康、安全、邻里关系和服务质量等多方面的挑战。华为技术有限公司提出智慧社区解决方案,旨在通过先进的数字化技术应对这些问题,提升城市社区的生活质量。 2. 技术推动智慧社区发展 技术进步,特别是数字化、无线化、移动化和物联化,为城市社区的智慧化提供了可能。这些技术的应用不仅提高了社区的运行效率,也增强了居民的便利性和安全性。 3. 智慧社区的核心价值 智慧社区承载了智慧城市的核心价值,通过全面信息化处理,实现对城市各个方面的数字网络化管理、服务与决策功能,从而提升社会服务效率,整合社会服务资源。 4. 多层次、全方位的智慧社区服务 智慧社区通过构建和谐、温情、平安和健康四大社区模块,满足社区居民的多层次需求。这些服务模块包括社区医疗、安全监控、情感沟通和健康监测等。 5. 智慧社区技术框架 智慧社区技术框架强调统一平台的建设,设立数据中心,构建基础网络,并通过分层建设,实现平台能力及应用的可持续成长和扩展。 6. 感知统一平台与服务方案 感知统一平台是智慧社区的关键组成部分,通过统一的RFID身份识别和信息管理,实现社区服务的智能化和便捷化。同时,提供社区内外监控、紧急救助服务和便民服务等。 7. 健康社区的构建 健康社区模块专注于为居民提供健康管理服务,通过整合医疗资源和居民接入,实现远程医疗、慢性病管理和紧急救助等功能,推动医疗模式从治疗向预防转变。 8. 平安社区的安全保障 平安社区通过闭路电视监控、防盗报警和紧急求助等技术,保障社区居民的人身和财产安全,实现社区环境的实时监控和智能分析。 9. 温情社区的情感沟通 温情社区着重于建立社区居民间的情感联系,通过组织社区活动、一键呼叫服务和互帮互助平台,增强邻里间的交流和互助。 10. 和谐社区的资源整合 和谐社区作为社会资源的整合协调者,通过统一接入和身份识别,实现社区信息和服务的便捷获取,提升居民生活质量,促进社区和谐。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值