Learning Collaborative Agents with Rule Guidance for Knowledge Graph Reasoning-学习笔记

本文提出了RuleGuider,一种结合基于符号和基于步行方法的知识图谱推理系统。RuleGuider由规则挖掘器和RL代理组成,代理在规则指导下学习推理路径。实验表明,RuleGuider在FB15k-237、WN18RR和NELL-995数据集上表现优秀,并通过人工评估验证了推理路径的合理性。
摘要由CSDN通过智能技术生成

目录

问题和初步

问题表述

基于符号的方法

基于步行的方法

提出的方法:RuleGuider

模型架构

Relation Agent

Entity Agent

Policy Network

Model Learning

奖励设计

培训程序

实验

实验装置

Datasets

Hyperparameters

结果

消融研究

人工评估

结论


问题和初步

  • 问题表述

给定一个查询:

KG推理的任务是找到一组对象实体,使得,其中中缺少的事实三元组。

为了与大多数现有作品保持一致,本文只考虑尾部查询。

  • 基于符号的方法

某些以前的方法是从KG挖掘Horn规则,并通过将这些规则作为基础来预测缺失的事实。 最近的方法AnyBURL(Meilicke et al.,2019)表现出与基于嵌入技术的最先进方法相当的性能。

但是,这些方法有局限性。 例如,从不同KG提取的规则可能具有不同的质量,这使得推理者难以选择规则。 图1显示了这种差异。 根据预测目标实体的准确性对规则进行排序。 WN18RR的最高规则比FB15K-237的最高价值。

图1:数据集之间的规则质量差异。 WN18RR存在高质量的规则。

  • 基于步行的方法

给定查询,基于步行的方法训练RL代理以查找从到期望的对象实体的路径,该路径暗含查询关系。 在步骤t,当前状态由元组表示,其中是当前实体。然后,代理对下一

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值