知识图谱中的知识表示学习（Representation Learning）

最新推荐文章于 2024-08-04 18:09:16 发布

lucas-nlp

最新推荐文章于 2024-08-04 18:09:16 发布

阅读量4.7k

点赞数 1

文章标签：知识图谱

Word Representation

1. one-hot representation

长度为词典长度，每个词在词典中的位置置1，其余置0
Curse of Dimension, 不适合太大的字典
互相正交，难以表示词语之间的相似性

2. distributed representation(词向量)

稠密、实值、低维的向量
便于Deep Learning
相似度用距离表示
word2vec
king-queen = man-woman

Knowledge Graph

基础

结构
- node = entity or class
- edge = relation
Fact
- (head, relation, tail)
- head = subject
- relation = predicate
- tail = object

表示

传统使用RDF格式表示知识图谱
目标: 将知识图谱编码到向量空间
方法: Trans系列

1. TransE (translating embedding)

对每个三元组，关系表示成从head到tail的向量，relation看做从head到tail的翻译。

h + r = t

第12行是损失函数，让正例的距离趋近0，让反例的距离尽量大。使用随机梯度下降法(SGD)训练。

2. TransH (translating on hyperplanes)

TransE过于简单，很难对一对多,多对一和多对多关系建模。TransH把关系映射到另一个空间。

h 丄 + r = t 丄

h 丄 = h - (w r) T h w r

t 丄 = t - (w r) T t w r

3. TransR (translation in the corresponding relation space)

TransE和TransH中，实体和关系全都在一个平面上，然而实体和关系都是不同类型的数据，全在一个平面上不合适。

一个实体是多种属性的综合体，不同关系关注实体的不同属性。直觉上一些相似的实体在实体空间中应该彼此靠近，但是同样地，在一些特定的不同的方面在对应的关系空间中应该彼此远离。

TransR为每个关系r设置了对应的矩阵M_r和向量r，h和t通过映射矩阵M_r转换为关系r相关的实体。

h r + r = t r

h r = M r h

t r = M r t

4. TransD (embedding via dynamic mapping matrix)

TransR中的映射矩阵M只和关系r有关，TransD是TransR的加强，它为每个实体和关系定义了两个向量，一个向量用来标识实体或关系的，另一个向量是projection vector，用来将实体转换为不同关系空间上的向量并用来生成映射矩阵。 TransD相比TransR/CTransR的计算，需要的属性更少，公式中没有矩阵乘以向量的运算，能运用在大规模的图计算上面。