笔记整理 | 谭亦鸣,东南大学博士
来源:ACL 20
链接:https://www.aclweb.org/anthology/2020.acl-main.578.pdf
1.介绍
图谱之间的异构差异是建立实体对齐的一个主要挑战,本文提出了Neighborhood Match Network (NMN),用于处理上述挑战。NMN的主要创新在于:
i.使用一个图采样方法(neighborhood sample)为每个实体提取一个不同的邻居;
ii.建立跨图邻居匹配模型对给定实体对的邻居差异进行联合编码。这种策略使得NMN能够有效的建立面匹配的实体表示,而忽略具有负面影响的噪声邻居。作者在DBP15K,DWY100K以及S-DBP15K等三个数据集上进行了充分实验,证明NMN能够在更困难的情况下评估邻居相似性,相对已有的12种方法也展现出更优的性能。
2.模型/方法
首先给出一些基本定义:
G表示一个KG
G = (E,R,T), E,R,T分别表示实体集,关系集,三元组集
方法用于构建两个KG之间的实体对齐,即G1和G2
任务的最终目的是获取G1与G2之间的等价实体pair
在真实KG之间,邻居异构以及通用噪声邻居的存在,使得对齐模型难以从中捕捉到有效的信息。为了解决这个问题,NMN首先使用GCN对邻居的拓扑信息进行建模,然后使用neighborhood sample选择更具价值的邻居,接着通过跨图匹配模型捕捉邻居差异。
图2给出了本文模型的主要框架流程: