笔记整理 | 谭亦鸣,东南大学博士生
来源:DASFAA’21
链接:https://arxiv.org/pdf/2101.10535.pdf
概述与动机
知识图谱对齐的目的是建立两个不同知识图谱之间实体的对应关系,如图1,本文作者发现现有的实体对齐方法依赖于标注数据,且无法很好的识别出“不存在对齐”的实体。为了解决这个问题,本文提供了一个面向开放域的无监督对齐框架UEA(非监督实体对齐)。具体做法是,模型首先从图谱的边缘信息挖掘出可用特征,然后建立一个“无匹配实体”预测模块,用于过滤图谱中“不存在对齐”的实体。过滤得到的初步结果被用做“伪标注数据”,作用于一种渐进式学习框架,生成图谱的结构表示,这些结构与边缘信息的结合能够提供更加全面的对齐视图。最后渐进式学习框架基于上一迭代的对齐结果生成新的伪标注数据,并不断增强对齐模型的性能。在不依赖标注数据的情况下,本文模型在DBP15K等常规对齐数据集上取得了较好的结果。