论文阅读笔记(3)——Translating Embeddings for Modeling Multi-relational Data

Abstract

我们考虑在低维向量空间中嵌入实体和多维数据关系的问题。目标是提出一种易于训练的规范模型,该模型包含数量减少的参数,并且可以扩展到非常大的数据库。因此提出了TransE,一种通过将关系解释为对实体的低维嵌入进行操作的翻译来建模关系的方法。尽管它很简单,但由于大量实验表明TransE在两个知识库的链接预测中明显优于最新方法,因此这种假设被证明是有效的。此外,它可以在具有1M 实体,25k关系和超过17M 训练样本的大规模数据集上成功进行训练。

1 Introduction

多重关系数据是指有向图,其节点对应于表单的实体和边缘(头,标签,尾巴)(表示为(h,l,t)),每一个都表明实体头之间存在名称标签的关系和尾巴。
多重关系数据模型在许多领域起着举足轻重的作用。例:社交网络分析:实体是成员,边(关系)是友谊/社交关系链接,推荐系统:实体是用户和产品,关系是购买,评级,评论或搜索产品。

Modeling multi-relational data

通常,建模过程归结为提取实体之间的局部或全局连接模式,并通过使用这些模式来概括特定实体与所有其他实体之间观察到的关系来执行预测。单一关系的本地性概念可能纯粹是结构性的。与单关系数据相反,在对数据进行描述性分析后可以进行即席而简单的建模假设,而关系数据的困难在于局部性的概念可能同时涉及不同类型的关系和实体,因此多关系数据建模需要更多通用方法,这些方法可以同时考虑所有异构关系来选择适当的模式。
继用户/项目聚类或矩阵分解技术在协作过滤中成功地表示单个关系数据中实体的连通性模式之间的非平凡相似性之后,大多数现有的多关系数据方法都在关系框架内进行了设计。
事实上,即使在复杂且异构的多关系域中,简单而适当的建模假设也可以在准确性和可伸缩性之间取得更好的折衷。

Relationships as translations in the embedding space

本文介绍了TransE,一个基于能量的模型,用于学习实体的低维嵌入。换句话说,关系在嵌入空间中表示为平动:如果(h,l,t)成立,那么尾部实体t的嵌入应该接近头部实体h的嵌入,加上某个依赖于该关系的向量。我们的方法依赖于一组简化的参数,因为它只学习每个实体和每个关系的一个低维向量。
我们基于平移的参数化背后的主要动机是层次关系在KBs中非常常见,而平移是表示它们的自然转换。
新模型的架构主要是为层次结构建模而设计的,在大多数类型的关系上都很强大,并且在真实世界KBs上的链接预测方面可以显著优于最新的方法。此外,它的光参数化使得它能够在包含1M个实体、25k个关系和超过17M个训练样本的Freebase大尺度分割上成功训练。

2 Translation-based model

给定一个由两个实体h, t∈E(实体集)和一个关系l∈L(关系集)组成的三元组(h, l, t)的训练集S,模型学习实体和关系的向量嵌入。嵌入以Rk为值(k是模型的超参数),并以相同的字母表示,以黑体字表示。模型的基本思想:函数关系引发的“l-labeled边缘对应于一个嵌入的翻译,即我们希望h + l ≈ t ,当(h,l,t)满足(t 是h+l的一个最近邻),否则h+l应该远离t。在基于能量的框架下,一个三元组的能量等于d(h + l, t)对于不同的度量d,我们取L1范数或L2范数。
为学习这样的嵌入,对训练集最小化一个基于边缘的排序准则:

L = ∑ ( h , ℓ , t ) ∈ S ∑ ( h ′ , ℓ , t ′ ) ∈ S ( h , ℓ , t ) ′ [ γ + d ( h + ℓ , t ) − d ( h ′ + ℓ , t ′ ) ] + \mathcal{L}=\sum_{(h, \ell, t) \in S} \sum_{\left(h^{\prime}, \ell, t^{\prime}\right) \in S_{(h, \ell, t)}^{\prime}}\left[\gamma+d(\boldsymbol{h}+\ell, \boldsymbol{t})-d\left(\boldsymbol{h}^{\prime}+\boldsymbol{\ell}, \boldsymbol{t}^{\prime}\right)\right]_{+} L=(h,,t)S(h,,t)

对于基于TransE或类似模型进行推理,通常可以采用以下步骤: 1. 构建知识图谱:将知识库中的实体和关系抽象成节点和边,构建一个图谱。 2. 训练TransE模型:使用知识图谱作为输入,训练TransE模型来学习实体之间的关系。 3. 进行推理:通过查找知识图谱中的实体和关系,进行推理。 其中,比较关键的是如何训练TransE模型。TransE模型的核心思想是将实体和关系映射到同一向量空间中,从而在向量空间中计算它们之间的相似度。在训练阶段,需要最小化实体和关系之间的距离,使得真实的三元组距离近,而虚假的三元组距离远。相似度可以使用余弦相似度或点积等函数计算,具体实现可参考论文《TransE: Translating Embeddings for Modeling Multi-relational Data》。 下面给出一个简单的例子:假设有一个知识库包含以下三元组: (Tom, hasChild, Harry) (Tom, hasChild, Lily) (Lily, sibling, Harry) 使用TransE模型,我们可以将Tom、Harry和Lily分别映射到向量空间中的三个向量,然后通过计算向量之间的距离,来推理Tom是否是Harry的父亲。具体过程如下: 1. 将实体和关系映射到向量空间中: Tom -> (0, 0) Harry -> (2, 0) Lily -> (1, 1) hasChild -> (1, 0) sibling -> (0, 1) 2. 通过向量之间的距离计算相似度: sim(Tom, hasChild, Harry) = cos((0+1-2)/3)-0.63 sim(Tom, hasChild, Lily) = cos((0+1-1)/3) ≈ 0.33 sim(Tom, sibling, Harry) = cos((0-1-2)/3)-0.94 由此可见,Tom与Harry之间的相似度较低,因此不能推断Tom是Harry的父亲。而Tom与Lily之间的相似度较高,说明Tom是Lily的父亲。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值