训练的目标是将每个实体嵌入到 D D D维实数空间 R D R^D RD。因此,两个实体的嵌入对于预测他们之间是否存在一个特定的关系类型是一个好的proxy。
更确切地,目标是对每一个实体学习一个嵌入,对每一个关系学习一个函数——每个关系类型的函数接受两个实体嵌入并为它们赋值,其目标是使积极关系比消极关系获得更高的分数。
所有在训练集中提供的边都是正实例。为了进行训练,一系列负的边也是需要的。他们不由用户提供,而是由系统在训练期间生成(负采样:通常是固定左手边实体和关系类型,采样一个新的右手边实体), 反之亦然。这种抽样方案对于大型稀疏图是有意义的,因为以这种方式生成的边是图中真正边的概率很低。
一个先验的实体嵌入可以采取 R D R^D RD中的任何值。尽管在某些情况(当把它们限制在一个球内,或者用余弦距离比较它们时的例子),他们的角度将比他们的范数更重要。
然而,每个关系得分函数都必须以某种特定的形式可表达的(文献中最常用的函数是可以将其转换成这样一种表示)。在当前的实现中,它们只允许转换其中一边的嵌入,然后使用通用的对称比较器函数将未转换的另一边的嵌入与之进行比较,对于所有关系都是一样的。正式地,左右手边的实体 x x x和 y y y,和关系 r r r,得分是:
f r ( θ x , θ y ) = c ( θ x , g r (