论文浅尝 | AAAI2020 - 基于生成对抗的知识图谱零样本关系学习-CSDN博客

本文链接：https://blog.csdn.net/TgqDT3gGaMdkHasLZv/article/details/105629466

该论文提出使用生成对抗网络为知识图谱中的未见过关系生成特征表示，以解决零样本关系学习问题。通过关系描述文本和噪声，生成器学习关系表示，而判别器则促进生成样本质量，提高预测能力。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

论文笔记整理：耿玉霞，浙江大学直博生。研究方向：知识图谱，零样本学习等。

来源：AAAI2020

论文链接：https://arxiv.org/pdf/2001.02332.pdf

本文是发表在AAAI2020上的一篇基于生成对抗网络进行知识图谱零样本关系学习的文章。在知识图谱表示学习（KG Embedding）的相关工作中，会出现一些未在训练数据集中出现过的关系（即 zero-shot relations），由于relation及其相关的三元组没有在训练数据集中出现过，则无法获得该relation训练好的向量表示，从而无法进行链接预测等下游任务。在这篇文章中，作者提出利用这些relations的文本描述信息以及生成对抗网络，为这些zero-shot relations学习到有语义意义的向量表示，从而避免KG中存在新出现的关系时，表示学习模型需要重新训练的问题。

1. 相关背景

1.1 基于生成对抗网络的零样本学习

零样本学习，即处理那些未在训练集中出现过的类别的分类问题。在训练集中出现过的类别（即seen classes），有训练数据，此类classes经训练具备一定分类该类测试样本的能力；而未在训练集中出现过的类别（即unseen classes），无训练数据，此类classes测试样本的分类/预测依赖与seen classes建立一定的语义联系（如文本描述、属性描述等），迁移相关seen classes的样本特征，使得unseen classes的样本特征得到学习，并最终实现分类。

近年来，随着生成对抗网络（Generative Adversarial Networks, GANs）在生成图片等方面的成熟运用，许多研究者将GANs引入零样本学习中，为unseen classes，这些缺少样本的classes生成训练样本，使得零样本学习转化为传统的监督学习，从而对unseen classes测试样本进行预测。

此类方法的一般框架为：基于类别的语义描述（文本描述等）及一些随机噪声，输入到GAN的生成器（Generator）中，生成该类别对应的样本特征；同时，在判别器（Discriminator）中，将生成的样本（fake data）与真实样本的特征（real data）经过对抗，使得生成器生成高质量的样本。经过训练的生成对抗网络，具备为unseen classes生成样本的能力。

1.2 知识图谱中的零样本关系学习

知识图谱的表示学习通常用于知识图谱的补全（链接预测等）任务，对于一个三元组，在给定头实体（head entity）及关系的情况下，预测其对应的尾实体（tail entity）。这篇文章的作者们考虑了KG中的零样本关系学习，即对于新出现的一些关系，在不经过表示学习算法重新训练的情况下，依然能在这些关系上进行链接预测的任务。

考虑KG中存在一些由seen relations组成的训练数据