(12)MPNet：基于多策略网络的时态知识图补全

StandByMe.

于 2024-06-19 11:30:01 发布

阅读量872

点赞数 10

文章标签：知识图谱人工智能

本文链接：https://blog.csdn.net/qq_51514930/article/details/139789354

版权

MPNet: temporal knowledge graph completion based on a multi-policy network | Applied Intelligence

1 引言

1.1 问题

①单个策略网络缺乏单独捕获实体和关系的动态和静态特征的能力。因此，它无法从多个角度全面评估候选人的行为。

②动作空间的构成是不完整的，常常将agent引向遥远的历史事件，而忽略了近期历史的答案。

③对于历史记录中没有出现的看不见的实体，现有的方法无法进行路径探索。有必要专门为这些看不见的实体构建新的行动空间，以促进它们的探索。

1.2 解决方案

提出了一种基于多策略网络(MPNet)的时态知识图补全方法。

具体地，①分别从静态实体关系、动态关系和动态实体三个方面构建策略，对候选人行为进行综合评价，促进高质量实体的识别，并帮助agent找到正确的答案。

②创建了一个更多样化的操作空间，使得智能体避免被困在遥远的历史中，使智能体在遇到未知实体时避免陷入遥远的历史，这增加了智能体找到目标实体的概率，提高了模型的预测性能。

1.3 相关概念

①时序知识图谱补全(TKGC)包括两个任务

插值和外推。插值任务的目的是从过去推断缺失的事实，其中测试集中的时间戳存在于训练集中。外推任务旨在预测未来发生的事实，其中测试集中的时间戳超出了训练集。与插值任务相比，时间知识图补全中的外推任务更具挑战性，并且由于待预测事实的时间戳在训练集中不存在，因此具有更大的实际意义。为了实现这一目标，现有模型试图深入挖掘相关的历史信息，这些信息在一定程度上反映了相关实体的属性。

2 MPNet

2.1 符号介绍

·知识图谱G={G_1，G_2，...，G_T}，其中GT=(E，R，F_t)表示时间戳t处的时序知识图谱快照。

E，R表示实体和关系的集合，F_t表示时间戳t下的所有事实(e_s , r, e_o, t)的集合。

时间戳t下的头、尾实体和关系

在时间戳t的动态嵌入

静态嵌入：e和r表示实体和关系。

（以下这个图麻烦、复杂、眼花缭乱，但下面静态动态策略内容都和它相关）

2.2 MPNet模型架构

架构简介：

由策略网络和奖励机制作为两个主要组成部分组成。策略网络包括静态实体关系策略(SERP)、动态实体关系策略(DEP)和动态关系策略(DRP)三种策略。

SERP基于实体和关系的静态特征对动作进行评分；DRP和DEP分别为实体和关系的动态特征对候选行为进行评分。

通过动态嵌入模块实现实体和关系的动态嵌入。DEP使用注意力机制将候选动态实体信息聚合为代理状态的一部分，帮助代理关注有价值的实体。每个候选操作的分数是通过使用操作计分器模块将三个策略的输出与候选操作相结合来计算的。然后根据得分对候选动作进行抽样。得分与被抽样的概率呈正相关。奖励机制通过评估agent在K跳后的位置给出相应的奖励。该模型期望最终的回报尽可能高。

2.3 强化学习架构

智能体（agent）在知识图谱中导航时使用的几种特殊类型的边（edges）。这些边允许智能体在图谱中移动，以发现隐藏的实体（entity）或关系（relation），从而帮助完成知识图谱。以下是每种类型边的详细解释：

这些特殊的边扩展了智能体在知识图谱中的移动能力，使其能够跨越时间边界、回溯历史以及利用已知关系来发现新的实体。这样的机制增强了智能体在知识图谱补全任务中的探索能力，提高了预测的准确性和效率。

e_q是一个看不见的实体。回溯边缘用红色虚线表示，关系相关边缘用紫色虚线表示，时间边缘用黑色虚线表示。(为了突出基本边和简单起见，省略了反向边、自环边和其他子图结构)

基于强化学习的方法可以表示为马尔可夫决策过程(MDP)。这个过程由一个环境和一个代理组成。环境代表tkg本身，代理可以抽象地理解为指向实体的指针。最初，它指向查询头部实体的位置，随后根据策略在知识图上移动。理想情况下，它应该在特定数量的步骤后指向正确的实体位置。下面将详细介绍MDP的组成部分。

状态 S表示状态，S ={H,Q}，其中H表示代理探索的历史信息，Q表示当前查询的信息。代理从查询实体出发，初始状态为S_0 ={H_0,Q}。具体来说，对于动态实体策略，输入状态表示为S_0 de ={H_0 de, C,Q}，其中C表示当前基于注意力的表示。

动作 A表示动作空间的集合。