模型:BootEA, AlignE
AlignE和BootEA几乎一样,但是AlignE没有用bootstrapping
Introduction
存在的挑战:1.尽管一个KG的嵌入模式在过去的几年进行了广泛的探索,但是对齐方向的仍然有很多没有探索到。2.基于嵌入的实体对齐通常依赖于现存对齐的实体作为训练数据。但是,可获得先对齐好的通常只占一小部分。
为了解决上面的挑战,我们提出一个bootstrapping的方式来解决。bootstrapping在半监督学习领域广泛的使用。它通过从labeled 和 unlabeled的数据迭代地训练。受这个idea的启发。
我们的贡献有以下几点:
我们把实体对齐当作一个分类任务。基于KG嵌入在所有标记的和未标记的数据中寻找最大对齐可能的
对于对齐导向的KG嵌入,我们提出了一个基于限制的公式。对于正三元组应该得到更低的分数,对于负样本得到更高的分数。为了对难以区分的负三元组进行采样,我们提出了一种截断的均匀负采样方法。 我们还将在不同KG的三元组之间交换对齐的实体,以在统一空间中校准嵌入。
为了克服缺乏训练数据,我们提出了一种bootstrapping方式,更新对齐导向的embedding通过标记可能已经对齐的并且把他们迭代地加入到训练数据中。它采用全局最优化来保证精确度,并且采用对齐的方式来减少错误累积
公式
我们定义x和y可能对齐的可能性:
我们要去选择一个
来得到最高对齐可能