笔记整理:黎洲波,浙江大学硕士,研究方向为自然语言处理、知识图谱。
研究背景
知识图谱因其在问答、语义解析和命名实体消歧等任务取得了良好的效果而受到广泛关注,而大部分知识图谱都存在不全和缺失实体链接的问题,所以需要进行链接预测(Link Prediction)和知识图谱补全(Knowledge Graph Completion)。知识图谱嵌入(Knowledge Graph Embedding)方法被提出来解决该问题。知识图谱嵌入是将知识图谱中所有的实体和关系嵌入到低维空间的方法,从基于距离的方法TransE到目前的效果最好的RotatE,在知识图谱补全任务上效果持续提升。
在知识图谱嵌入中,有两个主要问题受到广泛关注:
1.如何解决1对N,N对1和N对N的复杂关系表示问题。比如1对N的关系:基于距离的方法中,三元组(StevenSpielberg, DirectorOf, ?)的补全要求在经过关系变换DirectorOf后,Jaws和JurassicPark等实体能够距离StevenSpielberg更接近,但是使所有这类实体具有不同的表示是很困难的。2.如何通过已有的三元组学习和推断关系模式。关系模式例如对称(Symmetry)关系IsSimilarT,非对称(Antisymmetry)关系FatherOf,逆向(Inverse)关系PeopleBornHere和PlaceOfBirth以及组合(Composition)关系mother’s father is grandpa等等。
研究动机
之前的TransH、TransD和TransR等方法致力于解决复杂关系表示问题,却只能编码对称/非对称关系,最新的RotatE在编码对称/非对称关系,逆向关系和组合关系上取得了优异的效果,但是复杂关系的预测依然具有挑战性。由此,论文提出了一种新的知识图谱嵌入方法PairRE,它能够同时编码复杂的关系和多种关系模式。
研究方法
模型中使用的两个用于关系表示的向量将头尾实体分别投影到欧式空间,再最小化投影向量的距离。其形式化描述如下:
PairRE和前面提到的几种方法的比较如下,可以看出相比于R