#今日论文推荐#WWW 2022 | 无监督图结构学习_图结构数据中不可避免地存在噪声或缺失-CSDN博客

#今日论文推荐#WWW 2022 | 无监督图结构学习

近年来，图神经网络（graph neural networks，GNNs）被广泛应用于各种图数据相关的任务当中。然而，图神经网络的学习十分依赖于输入的图结构数据(即图数据中各节点的关联)，大大影响了其鲁棒性和普适性。一方面，现实系统中获取的图结构数据难免包含噪声信息，会存在多余边或缺失边的问题；在学习过程中，GNN 很容易受到这些噪声数据的影响，从而导致其性能下降。另一方面，对图结构的依赖也使得 GNN 无法应用于没有显式结构的非结构数据学习，尽管这些数据中可能存在隐性的结构信息。这种对输入结构的依赖，使得 GNN 难以应用于广泛存在于现实世界的非结构数据当中。
为了解决上述问题，现有方法对图结构学习（graph structure learning，GSL）进行研究，该技术旨在利用 GNN 对输入图结构本身进行学习和优化。目前的图结构学习主要遵循有监督范式，即：利用节点分类这一下游任务的标签信息，对图结构和 GNN 进行协同优化。这种范式虽被证明有效，却存在着一些局限性：
1. 依赖于标签信息，在有监督 GSL 方法中，在进行图结构优化时人工标注的标签在扮演了至关重要的角色，然而对标签数据的依赖限制了有监督 GSL 的在更广泛的无标签数据中的应用；
2. 学习到的边分布存在偏差，节点分类通常以半监督的形式进行，只有一小部分节点是有标签的（如在 Cora 数据集有标签节点的比例为 140/2708 ），因此这些标签节点之间的连接及其邻居会接收到更多的监督，从而造成学到的边分布存在不均匀和偏差；
3. 下游任务的局限性，在现有的方法中，结构学习通常依赖节点分类来提供监督信号，因此学习到的图结构通常是任务特定而不是通用的，可能对于下游其他任务没有帮助（如链接预测和节点聚类）。
为了解决上述局限，文中提出了一种新的用于 GSL 的无监督学习范式（unsupervised graph structure learning）。如图 1 所示，该学习范式不依靠任何额外的标签信息，仅根据输入数据本身对图结构进行学习或改进，因此学习到的图结构是通用的无偏的。针对新的学习范式，本文提出了一种基于结构自引导的自监督对比学习方法（StrUcture Bootstrapping Contrastive LearnIng fraMEwork, SUBLIME）。该方法主要有一下三点贡献：
1. 提出了一种新的用于 GSL 的无监督学习范式，相较于其他基于监督学习的 GSL，该范式更具有实践性。
2. 提出了一种新的无监督 GSL 方法——SUBLIME，该方法采用对比学习技术，从原数据本身中获取监督信号来引导结构学习，并同时利用学到的结构信息对监督信息进行更新。
3. 大量实验证明了 SUBLIME 的有效性。

论文题目：Towards Unsupervised Deep Graph Structure Learning
详细解读：https://www.aminer.cn/research_report/62b9975f7cb68b460fdcfd55https://www.aminer.cn/research_report/62b9975f7cb68b460fdcfd55
AMiner链接：https://www.aminer.cn/?f=cs