2019_NAACL_A Capsule Network-based Embedding Model for Knowledge Graph Completion and Search Persona

最新推荐文章于 2021-11-25 16:11:28 发布

Marilynmontu

最新推荐文章于 2021-11-25 16:11:28 发布

阅读量1.3k

点赞数 1

分类专栏：知识图谱嵌入文章标签：知识图谱

本文链接：https://blog.csdn.net/Marilynmontu/article/details/105438535

版权

知识图谱嵌入专栏收录该内容

1 篇文章 0 订阅

订阅专栏

代码地址：https://github.com/daiquocnguyen/CapsE

摘要

本文提出一种嵌入模型，名为CapsE，用胶囊网络建模三元组关系。
用一个三列的矩阵表示每个三元组，每列表示三元组(subject, relation, object)中的一个元素。然后将这个三列的矩阵喂给卷积层，用不同的卷积核生成不同的feature map，输入胶囊网络进行打分操作。有效的三元组分数很高，无效的三元组分数很低。

动机

1.大多数KG embedding模型都是为给定三元组的相同维度上的条目建模而构造的，中每个维度几乎都捕获了实体的一些特定于关系的属性。然而，现有的模型中没有一个具有用于在相同维度上对三元组中的条目进行建模的“深度”结构。
To the best of our knowledge, however, none of the existing models has a “deep” architecture for modeling the entries in a triple at the same dimension.

CapsE模型

符号描述

$v_s,v_r,v_o$ 分别为(subject, relation, object)的k维embedding。
在CapsE中，将每个embedding三元组 $v_s,v_r,v_o]$ 作为一个矩阵 $\mathbf{A}=[v_s,v_r,v_o] \in \mathbb{R}^{k\times3}$ ；
$\mathbf{A}_{i,:}\in\mathbb{R}^{1\times3}$ 表示矩阵 $A$ 的第 $i$ 行；
卷积层使用 $w\in\mathbb{R}^{1\times3}$ 的卷积核，使用该卷积核重复对 $A$ 的每一行做卷积操作，生成feature map $\mathbf{q}=[q_1,q_2,...,q_k]\in\mathbb{R}^k$ ，其中， $q_i=g(w\cdot\mathbf{A}_{i,:}+b)$ ，该式中的 $\cdot$ 表示点乘， $b\in\mathbb{R}$ 为偏置项， $g$ 为非线性函数如ReLU，因此生成的 $q_i\in\mathbb{R}^k$ 。
本文中使用的卷积核集合表示为 $\Omega$ ，总数表示为 $N=|\Omega|$ ，因此卷积层会生成 $N$ 个 $k$ 维的feature map，每一个特征映射可以捕获相同维度内的某个条目的某种特性。

模型架构

在这里插入图片描述

卷积层：

输入：矩阵 $A=[v_s, v_r, v_o]\in\mathbb{R}^{k\times3}$ ，此例中 $k = 4$
卷积核： $N$ 个卷积核 $w\in\mathbb{R}^{1\times3}$ ，此例中 $N = 5$
激活函数：ReLU，有 $q_i=g(w\cdot\mathbf{A}_{i,:}+b)$
输出：一个feature map表示为 $\mathbf{q}=[q_1,q_2,...,q_k]\in\mathbb{R}^{1\times k}$ ，此例中 $k = 4$ ，共4维，共5个fearture map。

第一层胶囊层：

由 $k = 4$ 个胶囊组成
输入：5个fearture map，一个feature map表示为 $\mathbf{q}=[q_1,q_2,...,q_k]\in\mathbb{R}^{k}$
输出： $\mathbf{u}=[u1,u2,...,u_k]$ ，其中， $\mathbf{u}_i\in\mathbb{R}^{N\times1}$

Routing process：

输入： $\mathbf{u}=[u1,u2,...,u_k]$
输出： $\hat{\mathbf{u}}_i=\mathbf{W}_i\mathbf{u}_i$ ， $\mathbf{W}_i\in\mathbb{R}^{d\times N}$ ， $\mathbf{u}_i\in\mathbb{R}^{N\times1}$ ， $\hat{\mathbf{u}}_i\in\mathbb{R}^{d\times1}$ ;
$\mathbf{s}=\sum_ic_i\hat{\mathbf{u}}_i$ ， $\mathbf{s}\in\mathbb{R}^{d\times1}$ ;
在这里插入图片描述

第二层胶囊层：

输入： $\mathbf{s}=\sum_ic_i\hat{\mathbf{u}}_i$ ， $\mathbf{s}\in\mathbb{R}^{d\times1}$ ;
输出： $\mathbf{e}=squash(\mathbf{s})$ ， $squash(\mathbf{s})=\frac{||\mathbf{s}||^2}{1+||\mathbf{s}||^2}\frac{\mathbf{s}}{||\mathbf{s}||}$ ，耦合系数 $c_i$ 由路由过程决定；

打分函数：输出向量 $\mathbf{e}$ 的长度作为输入三元组的分数。打分函数如下：
$f(s,r,o)=||capsnet(g([v_s,v_r,v_o]*\Omega))||$

损失函数：对数损失函数，在KG embedding中很常见。
在这里插入图片描述

Marilynmontu

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
2019_NAACL_A Capsule Network-based Embedding Model for Knowledge Graph Completion and Search Persona

代码地址：https://github.com/daiquocnguyen/CapsE摘要本文提出一种嵌入模型，名为CapsE，用胶囊网络建模三元组关系。用一个三列的矩阵表示每个三元组，每列表示三元组(subject, relation, object)中的一个元素。然后将这个三列的矩阵喂给卷积层，用不同的卷积核生成不同的feature map，输入胶囊网络进行打分操作。有效的三元组分数很高...
复制链接

扫一扫