论文地址:
一、研究领域
在如社交网络、语义网络、生物信息学与人工智能等等的领域上,关系学习变得越来越重要。在应用上,关系学习可用于链路预测、集体分类等等。例如,对于知识图谱领域,关系学习可用于知识推理和补齐技术,对残缺和带有错误信息的知识图谱进行知识推理和补齐,对于知识图谱而言,一般使用结构化的RDF三元组信息来表示,因此对于本论文提出的模型——RESCAL,输入为结构化的三元组信息,输出则为学习到的知识图谱实体和关系之间的潜在信息,这些信息可以应用于下游的机器学习任务。
二、论文动机
从建模的角度来看,张量(tensor)提供了简单性,因为无论多少阶的多元关系都可以直接由高阶的张量表示。并且,张量方法不需要已知关于问题结构的先验知识,也不需要从数据中推理,因为这是必要的,例如贝叶斯网络或马尔可夫逻辑网络(MLN)等图结构模型。从学习角度来看,使用张量分解方法的一个原因是,关系域通常是高维且稀疏的,在这种情况下,因子分解方法已经显示出非常好的结果。
然而,此前的一些著名的张量分解方法(如CP、Tucker)无法有效地建模集体学习,难以捕捉相关实体的属性、关系或类别;尽管随后出现的DEDICOM可以实现,但是不幸地它存在着约束以致于无法合理地应用到关系学习上,因此只能产生次优的结果。
因此,作者在论文里提出了一个新的关系学习方法——RESCAL,这个方法基于跟DEDICOM相关的张量分解方式,但不存在像DEDICOM那样的约束条件,因此这个方法有着高质量和相比明显的时间复杂度提升,并且取得了与当时的SOTA模型类似甚至更优的结果。