论文阅读笔记5 Translating Embeddings for Modeling Multi-Realtional Data

最新推荐文章于 2024-07-15 15:32:14 发布

墨痕_777

最新推荐文章于 2024-07-15 15:32:14 发布

阅读量388

点赞数 8

文章标签：论文阅读笔记

本文链接：https://blog.csdn.net/mohen_777/article/details/140178300

版权

论文阅读笔记5：TransE

论文《Translating Embeddings for Modeling Multi-Realtional Data》阅读笔记

老生常谈的Introduction

将关系和实体用低维向量进行表示是一个很常见的问题(这个时候知识图谱的概念还没有提出)，而关系和实体可以使用一个三元组(head, realtion, tail)来表示，而在多关系的数据中，关系可能有很多个并且是异构的，这个时候传统的方法就不太好用了。

这篇论文中提出了一种基于Translation(转化)的思想，首先将一系列实体表示成向量空间中的一系列向量，然后将relation看成是从head到tail的一种translation，这样的方法可以大幅度减少参数的规模，并在处理一对一的关系中取得了非常好的表现，但是在处理一对多，多对一和多对多的关系中表现并不好，因为TransE模型中只把关系和实体都表示成一个向量，所以不好表示含多个实体的关系。

Trans模型的具体描述

基本的定义

假设训练集S包含一系列三元组 $(h, l, t)$ ，所有的实体组成集合E而所有的关系组成集合L，模型的目标就是去学习到一系列实体和关系的嵌入表示，并且要使得 $h+l\approx t$ ，并且在基于能量的框架下，能量可以使用一个有关三元组的函数 $d (h + l, t)$ ，而能量函数d一般是在d维度空间中衡量向量的不相似度(可以是相似度的相反数)的函数，往往采用L1或者L2范数。

学习的目标

为了学习到满足 $h+l\approx t$ 的嵌入表示，TransE提出的目标函数采用了如下这种基于margin的形式：
$\mathcal{L}=\sum_{(h, \ell, t) \in S} \sum_{\left(h^{\prime}, \ell, t^{\prime}\right) \in S_{(h, \ell, t)}^{\prime}}\left[\gamma+d(\boldsymbol{h}+\boldsymbol{\ell}, \boldsymbol{t})-d\left(\boldsymbol{h}^{\prime}+\boldsymbol{\ell}, \boldsymbol{t}^{\prime}\right)\right]_{+}$
其中 $x]_+$ 表示向量x中的正数部分，并且 $\gamma>0$ 是一个margin超参数，并且：
$S_{(h, \ell, t)}^{\prime}=\left\{\left(h^{\prime}, \ell, t\right) \mid h^{\prime} \in E\right\} \cup\left\{\left(h, \ell, t^{\prime}\right) \mid t^{\prime} \in E\right\}$
是一个负采样集合，是将训练集中的三元组改变其head或者tail生成一个坏样本产生的，并且损失函数希望正常样本的能量要比坏样本的能量要低，因此负采样起到了这样一种监督作用，同时学习过程中的优化采用SGD完成。

具体算法

TransE模型的具体算法如下：