Few-Shot Knowledge Graph Completion阅读笔记

最新推荐文章于 2023-05-25 18:00:11 发布

小白一枚~

最新推荐文章于 2023-05-25 18:00:11 发布

阅读量1.4k

点赞数 1

分类专栏：知识图谱文章标签：深度学习机器学习知识图谱

本文链接：https://blog.csdn.net/weixin_43676040/article/details/112996386

版权

知识图谱专栏收录该内容

2 篇文章 0 订阅

订阅专栏

Few-Shot Knowledge Graph Completion

原文下载
AAAI 2020

摘要

知识图谱作为多种自然语言处理应用的有用资源。原来知识图谱的补全方法要求每种关系拥有大量的训练实例(例如头部-尾部实体)。但是在真实的场景中，对于大多数实体仅有少数的实体对可以得到。并且现有小样本学习方法对于小样本的场景缺乏一般性也没有充分利用监督信息；然而小样本知识图谱补全还没有被很好的研究。在本文工作中作者提出了一个新颖的小样本关系学习模型(FSRL)目的是为了基于给定的参考集发现新关系的实体。FSRL能够有效的从异构图结构中捕获知识，聚合小样本参考集的表示并且匹配每种关系参考集的实体对的相似性。另外作者在两种公开数据集上证实了FSRL方法的优越性。

主要贡献点

提出一种新的小样本补全任务，不同于之前的方法，同时更适合实际场景
提出了一种融合了一些可学习神经网络模块的小样本关系学习模型解决此问题
在两个公开数据集上做了拓展实验，结果表明本文提出的模型较优

问题定义

知识图谱G被表示为一个三元组的集合：
$\{(h,r,t) \} \subseteq \varepsilon \times R \times \varepsilon$

其中， $\varepsilon$ 表示实体集， $R$ 表示关系集合。

知识图谱补全：
在给定头部实体 $h$ 及查询关系 $r$ ，预测尾部实体 $t$ ：{( $h$ , $r$ , ?)} ；或者根据头部和尾部实体预测关系 $r$ 。
本文研究内容为前一种情况。

模型

模型架构

模块介绍

${\color{red} Encoding \ Heterogeneous \ Neighbors}$

此模块功能为一个关系可感知的异构邻居编码器。基于给定头实体 $h$ 的关系邻居的集合被表示为：
$N_h= \{(r_i,t_i)|(h,r_i,t_i)\in G'\}$
其中， $G^{'}$ 表示背景知识图谱, $r_i,t_i$ 分别表示第 $i$ 个关系和相应的 $h$ 的尾部实体。
$f_\theta(h)=\sigma(\sum_{i} \alpha_i e_{t_i}) \\[8pt] \alpha_i=\frac{exp\{u_{rt}^{T} (\mathcal{W}_{rt}(e_{r_i}\oplus_{t_i})+b_{rt})\}} {\sum_jexp\{u_{rt}^{T} (\mathcal{W}_{rt}(e_{r_j}\oplus_{t_j})+b_{rt})\}}$
其中， $\sigma$ 表示激活函数， $e_{t_i},e_{r_i}$ 分别表示 $t_i,r_i$ 的预训练的embedding。 $u_{rt}\in \R^{d\times1},\mathcal{W}_{rt}\in \R^{d\times2d},b_{rt}\in \R^{d\times1}$ 均为可学习参数， $d$ 为预训练的embedding的维度。
${\color{red}Aggregating \ Few{-}Shot \ Reference \ Set}$

此模块功能为: 对参考集中 $R_r$ 每个关系 $r$ 的embedding进行聚合。
$f_\epsilon(R_r)=\mathcal{AG}_{(h_k,t_k)\in R_r}\{ \varepsilon_{h_k,t_k}\} \\[8pt] \varepsilon_{h_k,t_k}=[f_\theta(h_k)\oplus f_{\theta}(t_k)]$
其中， $\mathcal{AG}$ 是一个聚合函数。 $\oplus$ 表示连接操作。
基于图的embedding，作者设计了一个循环自编码聚合器。更具体来说，实体对embeddings $\varepsilon_{h_k,t_k}\in R_r$ 被顺序喂到循环自编码器：
$\varepsilon_{h_1,t_1} \rightarrow m_1\rightarrow...\rightarrow m_K \rightarrow d_K \rightarrow...\rightarrow d_1$
其中， $K$ 是参考集的大小(小样本的大小)。编码与解码阶段的隐藏状态 $m_k$ 与 $d_k$ 计算公式如下：
$m_k=RNN_{encoder}(\varepsilon_{h_k,t_k},m_{k-1}) \\[8pt] d_{k-1}=RNN_{decoder}(d_k)$
其中， $RNN_{encoder}与RNN_{decoder}$ 分别表示循环编码器与解码器。
优化自编码器的重构损失如下：
$\mathcal{L}_{re}(R_r)=\sum_k ||d_k-\varepsilon_{h_k,t_k}||_2^2$
为了形成参考集的embedding,作者聚合了所有编码的隐层状态并通过残差连接与注意力权重机制进行拓展。因此， $f_\epsilon(R_r)$ 的计算公式如下：
$m_{k}^{'}=m_k+\varepsilon_{h_k,t_k} \\[8pt] \beta_k=\frac{exp\{u_{R}^{T} (\mathcal{W}_{R}m_{k}^{'}+b_{R})\}} { \sum_{k'}exp\{u_{R}^{T} (\mathcal{W}_{R}m_{k'}^{'}+b_{R})\}} \\[8pt] f_{\epsilon}(R_r)=\sum_k \beta_k m_{k}^{'}$
$u_{R}\in \R^{d\times1},\mathcal{W}_{R}\in \R^{d\times2d},b_{R}\in \R^{d\times1}$ 均为可学习参数， $d$ 为聚合的embedding的维度。
${\color{red}Matching \ Query \ and \ Reference \ Set}$

在前两个模块的基础上，现在可以基于参考集 $R_r$ 有效的对每个查询实体对 $h_l,t_l)$ 进行匹配操作。首先通过对查询实体对 $h_l,t_l)$ 和参考集 $R_r$ 分别进行 $f_{\theta}$ 与 $f_{\epsilon}$ 操作，从而分别得到两个embedding向量： $\varepsilon_{h_l,t_l}=[f_{\theta}(h_l)\oplus f_{\theta}(t_l)]$ .
为了衡量两个向量的相似性，作者采用了一个循环处理器 $f_\mu$ 去完成多步匹配。第 $t$ 个过程步的如下：
$g_{t}^{'},c_t=RNN_{match}(\varepsilon_{h_l,t_l},[g_{t-1}\oplus f_{\epsilon}(R_r)],c_{t-1}) \\[8pt] g_t=g_{t}^{'}+\varepsilon_{h_l,t_l}$
其中，输入为 $\varepsilon_{h_l,t_l}$ ,隐藏状态为 $g_t$ ,细胞状态为 $c_t$ 。 $T$ 过程步后的隐层状态 $g_T$ 记为： $\varepsilon_{h_l,t_l}=g_T$ 。
${\color{red}Objective\ and\ Model\ Training}$
对于每一个关系r,我们随机选择一些正样本实体对 $\{ (h_k,t_k)|(h_k,r,t_k)\in G\}$ 并把它们作为参考集 $R_r$ 。剩余的实体对 $\mathcal{P}\varepsilon_r=\{(h_l,t_l)|(h_l,r,t_l)\in G \cap (h_l,t_l) \not \in R_r\}$ 作为正样本查询对。此外，也构建了负样本实体对 $\mathcal{N}\varepsilon_r=\{(h_l,t_{l}^{-})|(h_l,r,t_{l}^{-})\not \in G\}$ 。排列损失记为：
$\mathcal{L}_{rank}=\sum_r \sum_{(h_l,t_l)\in \mathcal{P}\varepsilon_r} \sum_{(h_l,t_{l}^{-})\in \mathcal{N}\varepsilon_r}[\xi+s_{(h_l,t_{l}^{-})}-s(h_l,t_l)]_+ \qquad (9)$
其中， $x]_+=max[0,x]$ 为标准的hinge 损失， $\xi$ 表示安全边界距离(本文取值为5)。
最终优化函数如下：
$\mathcal{L}_{joint}=\mathcal{L}_{rank}+\gamma \mathcal{L}_{re} \qquad(10)$
其中， $\mathcal{L}_{re}$ 表示参考集聚合的重构损失。 $\gamma$ 表示两者的权衡因子(本文取值为0.0001)。

FSRL算法过程如下：
在这里插入图片描述

数据集

在这里插入图片描述
训练集/验证集/测试集划分：
NELL:51/5/11
WiKi:133/16/34

实验结果

在这里插入图片描述

Ablation Study

其中AS_1表示使用mean pooling layer代替heterogeneous neighbor encoder；AS_2a使用mean pooling来代替 recurrent autoencoder aggregation ；AS_2b使用mean pooling代替attention weight；AS_2c移除decoder，只是使用encoder；AS_3移除了匹配网络中的LSTM。

Impact of Few-Shot Size
在这里插入图片描述
Embedding Visualization

** 如有错误欢迎各位批评指正！大家共同进步~ **

小白一枚~

关注

1
点赞
踩
8

收藏

觉得还不错? 一键收藏
5
评论
Few-Shot Knowledge Graph Completion阅读笔记

Few-Shot Knowledge Graph Completion原文下载AAAI 2020摘要知识图谱作为多种自然语言处理应用的有用资源。原来知识图谱的补全方法要求每种关系拥有大量的训练实例(例如头部-尾部实体)。但是在真实的场景中，对于大多数实体仅有少数的实体对可以得到。并且现有小样本学习方法对于小样本的场景缺乏一般性也没有充分利用监督信息；然而小样本知识图谱补全还没有被很好的研究。在本文工作中作者提出了一个新颖的小样本关系学习模型(FSRL)目的是为了基于给定的参考集发现新关系的实体。FS
复制链接

扫一扫