一、摘要
文章提出了一种结合【实体外部描述】和【三元组】的知识图谱表示学习方法。在【知识图谱补全】和【实体分类】两个任务上取得了很大的提升。并且很重要的一点是,该方法能够自然地解决【实体不在图谱中的问题】。
二、简介
文章使用了两种表示方法进行知识图谱表示:
- 基于结构的表示方法,如
Trans-E
等。 - 基于描述的表示方法,利用对实体或者关系的自然语言描述生成的表示。
三、方法
文章在相同的向量空间中学习两类实体表示,具体的方法是通过优化下式
其中
E
S
E_S
ES是Trans-E
等方法的优化目标,而
用来对其两个表示的空间。
基于结构的表示方法,如Trans-E
就不做介绍。而基于描述的表示方法,文章给出了两种。
词袋模型编码器
这里首先我们拥有头实体和尾实体的描述信息,然后通过TF-IDF
等算法对描述中的词进行排序找到【关键词】,将关键词的embedding
加起来得到实体的embedding
CNN编码器
四、实验结果