摘要
开放世界知识图补全旨在通过实体描述找到一组缺失的三元组,其中实体可以在图内也可以在图外。然而,现有的大多数模型在将实体描述的词嵌入矩阵聚合为单个嵌入时,要么使用CNN和LSTM使模型复杂而无效,要么使用简单的语义平均,忽略了实体描述中不同词之间的不平等性质。本文提出了一种聚合器,采用注意网络的方法来获取实体描述中单词的权重。这既不打乱词嵌入中的信息,又使聚合的单一嵌入更加有效。实验结果表明,该模型在开放世界KGC任务中具有较好的性能。
1.介绍
知识图是由实体(节点)和关系(不同类型的边)组成的多关系图。每条边都表示为一个三元组(头、rel、尾),这表明两个实体由特定的关系连接。例如,像“北京是中国的首都。可以表示为。近年来,KGs已被应用于问答[1]、信息提取[2]等领域。虽然KGs可以有效地表示结构化信息,但在应用中存在一些问题,如数据质量问题和数据稀疏性问题。知识图补全(KGC)就是用来解决这些问题的。它的目的是通过评估缺失三元组的可能性来丰富不完整的图。一种常见的方法是使用向量嵌入学习实体和关系的低维表示。这些典型的基于嵌入的KGC算法可以分为基于事实的模型和附加信息的模型。基于事实的模型只使用从三元组中提取的事实来学习嵌入,这种模型又可分为