《Deep Learning for Community Detection-Progress, Challenges and Opportunities》简要笔记

本文记录阅读《Deep Learning for Community Detection-Progress, Challenges and Opportunities》的简要笔记
论文基本信息:
会议名:International Joint Conference on Artificial Intelligence (IJCAI)
会议级别:CCF-A(人工智能)
年份:2020
标题:Deep Learning for Community Detection-Progress, Challenges and Opportunities
作者及工作单位:image.png

Abstract

社区内成员具有相似的观点、相似的功能、相似的目的等,社区发现在科学研究和数据分析中都是非常重要和有用的工具。(指明社区发现的重要性)然而,经典的社区发现方法,如聚类聚类和统计推断,正在被淘汰。因为深度学习方法显示出越来越多的能力来处理高维图数据,并具有很好的性能。(经典方法的不足,引出DL)因此,总结深度学习方法在社区发现领域的当前进展是及时的。(必要性)本文分为该领域的三大研究点——deep neural networks、deep graph embedding、graph neural networks,总结了每个研究点中各种框架、模型和算法的贡献,以及目前尚未解决的挑战和未来的研究机遇。(本文内容

1 Introduction

如何判断是否是社区?

网络和图的两个基本元素是节点和边。图理论提供了两个规则来判断节点和边是否能形成一个社区:(1)一个社区内的节点是紧密联系的(2)不同社区内的节点具有稀疏连接。
一个简单的理解是,社区是包含更多内部连接而不是外部连接的子图。
如下图所示,分为 C1 和 C2 两个社区
image.png

传统社区发现方法的不足

大多数传统的社区发现方法是基于统计推断和传统的机器学习方法。然而,尽管这些方法在过去取得不错的效果,但面对当今复杂的数据集和复杂的社会场景,这一策略很难。在传统的机器学习中,社区发现通常被认为是图上的聚类问题,但这些方法高度依赖于数据的特征。因此,迫切需要更强大的技术。

深度学习方法的优势

通过深度学习,计算模型可以在多个层次上学习数据的表示,这非常适合网络数据。此外,它学习非线性特征的能力也有了很大的进步,在数据有内在关系的广泛领域,如计算机视觉和自然语言处理,都取得了成功。此外,深度神经网络可以降低数据的维数,这扩大了社区发现、节点分类和链路预测等网络分析任务的范围。

本文的三个主要部分

(1)回顾和评估各种深度学习方法在社区发现中的优势;
(2)从技术层面总结和分类当前最先进的研究;
(3)确定并讨论尚未解决的技术挑战,以及未来研究的机遇

2 Community Dtection

介绍 网络(Network)和 社区(Community)的概念

Network

根据图论,加权网络表示为G = (V, E, W),未加权网络表示为G = (V, E),其中V和E分别表示节点和边的集合,W表示E对应的权重。在非加权网络中,W被认为是1,可以从G中去除。
子图 g⊆G 是保留原始网络结构的图的一个分区。子图的划分遵循预先定义的规则,不同的规则会产生不同形式的子图。社区是一种表示真实社会现象的子图。换句话说,社区是一群具有共同特征的人或物。

Community

社区是网络中的子图,其中节点共享密集的连接。我们使用C = {C1, C2,…, Ck}表示从网络G中划分出的k个社区体的集合,其中Ci是该网络分区的第i个社区。聚类到到社区Ci中的节点v满足一个条件:社区内每个节点的入度大于其出度。

3 Why Detection by Deep Learning?

本章介绍采用深度学习方法来发现社区的优势
总结:
(1)采用深度学习方法能改进性能
(2)能够基于更丰富的特征来发现社区(高维特征数据)
(3)基于网络拓扑和节点属性的社区发现能力,以获得更健壮、性能更好的模型
(4)在大规模网络中检测更复杂结构的能力(拓扑结构)

4 Community Detection with Deep Learning

本章从技术上概述了用于社区发现的深度学习的最新研究进展。每个小节涵盖了三大类方法中的一种,即深度神经网络、深度图嵌入和图神经网络。

5 Challenges and Opportunities

尽管近年来,特别是最近五年,我们目睹了深度学习在社区发现方面的快速发展,但仍有一些问题需要更好的解决方案,挑战仍未解决。

社区数量:社区发现前,我们并不知道要划分成多少个社区(相当于聚类里的聚类簇数,可视为一个超参数)
分层网络:由多层网络组成。对于多层网络,社区发现若能够提取分层表示,则社区发现效果更好。
网络异质性:对于异质网络,社区发现将会有更大的挑战性
边的信息:如何考虑边的不同信息?
社区嵌入表示:关注的是整个社区的表示,而不只是节点表示(不止1阶和2阶邻居,如何去获取更高阶邻居的信息)
网络动态性:如今的社交网络是变化的,如何关注到网络动态性?(如拓扑结构改变)
大规模网络

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值