图神经网络时代的深度聚类

最新推荐文章于 2024-05-23 10:13:16 发布

PaperWeekly

最新推荐文章于 2024-05-23 10:13:16 发布

阅读量6.4k

点赞数 8

本文链接：https://blog.csdn.net/c9Yv2cf9I06K2A9E/article/details/104935095

版权

©PaperWeekly 原创 · 作者｜纪厚业

学校｜北京邮电大学博士生

研究方向｜图神经网络和推荐系统

聚类作为经典的无监督学习算法在数据挖掘/机器学习的发展历史中留下了不可磨灭的印记。其中，经典的聚类算法 K-Means 也被选为数据挖掘十大经典算法。随着深度学习的兴起，一些工作尝试将深度学习技术（如 Autoencoder ）引入到传统聚类算法中，也取得了不错的效果。

近些年，图神经网络已经成为深度学习领域最热门的方向之一，也在推荐/自然语言处理/计算机视觉等很多领域得到了广泛的应用。

那么，能不能利用图神经网络强大的结构捕获能力来提升聚类算法的效果呢？本文梳理总结了图神经网络赋能的深度聚类算法，供大家参考。

IJCAI 2019

论文标题：Attributed Graph Clustering: A Deep Attentional Embedding Approach

论文来源：IJCAI 2019

论文链接：https://arxiv.org/abs/1906.06532

1.1 论文动机

本文认为之前的深度聚类算法都是 two-step 的：首先学习数据的特征表示 embedding，然后基于特征表示进行数据聚类。这样所学习的数据 embedding 并不是任务导向的。那么，如果能够在学习 embedding 的过程中，针对聚类任务做一些针对性的设计，那么学习到的 embedding 自然可以实现更好的聚类。

针对上述问题，本文提出了一种聚类导向的深度算法 Deep Attentional Embedded Graph Clustering (DAEGC)。DAEGC 一边通过图神经网络来学习节点表示，一边通过一种自训练的图聚类增强同一簇节点之间的内聚性。

下图清晰的展示 two-step 和本文所提出的 DAEGC 的差异。