FacetNet简介

这篇论文也是基于进化聚类的一个框架,被发表在2008年的WWW会议上,它到底有何亮点呢,让我们一起来看看吧!

论文题目:《FacetNet: A Framework for Analyzing Communities and Their Evolutions in Dynamic Networks》

作者:亚利桑那州立大学的Yu-Ru Lin et al.

摘要:我们从社交网络数据中发现社区,并分析他们的演变。这些社区是在线社交网络和论文引用网络中人类互动的固有特征之一。此外,由于每个人在网络中的角色和社会地位的变化以及个人研究兴趣的变化,社区可能会随着时间的推移而演变。我们提出了一个创新的算法,它摒弃了传统的两步分析社区演变法。在传统的方法中,首先对每个时间片检测社区,然后进行比较以确定对应关系。我们认为这种方法不适用于有噪声数据的应用程序。我们在本文提出FacetNet框架通过一个健壮的统一过程来分析社区和它们的演化。在这个新的框架中,社区不仅产生演化,而且通过演化的时间平滑性对其进行正则化。(In this novel framework, communities not only gen- erate evolutions, they also are regularized by the temporal smoothness of evolutions.)因此,该框架将拟合当前和历史数据,来发现最优社区。我们的方法依赖于以非负矩阵因子分解的形式对问题进行表述,其中社区和它们的演化以统一的方式进行分解。在此基础上,我们提出了一种迭代算法,该算法具有较低的时间复杂度,并保证收敛到最优解。我们对合成数据集和真实数据集进行了广泛的实验研究,以证明我们的方法发现了有意义的社区,并提供传统方法无法直接获得的额外见解(insights)。

分类:Database Applications——Data mining,Information Search and Retrieval——Information filtering,Social and Behavioral Sciences——Economics

关键词:Community,Evolution,Soft Membership,Non-negative Matrix Factorization,Community Net,Evolution Net

简介:来自许多社交网络数据集的数据,包括论文协作网和博客圈,是一个图,其中节点表示个人(例如,俱乐部成员、作者和博客作者),边表示个人之间的关系和交互(interactions)(例如,俱乐部和协作网中的交互、博客中的超链接)。在这样的社交网络中,个体通过相互建立关系和互动来形成社区。对这些群体的分析(成员关系,结构和时序动态)是一个重要的研究课题。

传统的社交网络分析将网络视为一个静态图,要么是来自所有时间的数据集合,要么作为特定时间的数据快照。这些研究涵盖了从稳定的社交网络分析到最近成功的应用,如HITS和PageRank。然而,本研究忽略了网络数据中社区的一个重要特征——社区时间演化。由于忽略了社区的演化,先前的工作漏掉了在线社区的一个关键的方面。

最近,越来越多的研究工作来分析动态网络中的社区及其演化。然而,这些研究的共同的缺点是社区发现和社区演化的研究是分开的——通常社区结构是从连续的时间步中提取出来,然后回溯所有社区结构,引入了进化特征来解释这些社区结构的区别。当社区结构明确时,这种两阶段方法是有意义的(如,当有社区标记(affiliation)时)。然而,通常现实世界网络是模糊并且有噪声的。在这种环境下,如果算法独立于其他时间步对每个时间步提取社区结构,通常会导致结果中的社区结构具有很高的时间变化性。因此,为了解释这种社区结构的高度变化,不得不引入一些不合适进化特征。因而,我们认为将社区及其演化放在统一框架中进行分析是一种更合适的方法。在这个框架中,社区结构和演化历史一起构造合适的当前社区结构。比如,在短期内社区结构演化过快是不可取的。

当前社区分析技术中另一个常见的问题是一个人同一时间只分配给一个社区。相反,一个人可能在同一时间参加多个社区。如,一个博主即是舞蹈大师,同时也是业余摄影师。因此,同时参与多个社区的人应该分配到多个社区中。我们认为,与硬(hard)社区不同,软(soft)社区成员关系可以提供更多的信息,因为它提供了关于个人如何参与每个社区的更多细节。

本文提出了一个分析动态网络中社区及其演化的系统框架,并将其命名为FacetNet。我们主要贡献有以下三点:

1.我们引入FacetNet框架用一个统一过程来分析社区及其演化。在我们的框架中,一个给定的时间步t上的社区结构同时由t时刻的网络数据和历史社区的演化模式(historic community evolution patterns)共同决定。因此,我们发现的社区及其演化对噪声数据有更强的鲁棒性和合理性。(例如,短期内不太可能发生巨大的变化)。

2.将Yu等人提出的软(soft)聚类算法从静态图扩展到动态图。与硬(hard)社区划分不同,在我们的框架中,个人可以同时参与多个社区,并具有不同的参与度。类似的,观察到了由于不同社区的共同影响而产生的关系。基于软社区成员关系,我们进一步给出了两个新的概念——Community Net 和Evolution Net,分别代表了社区结构及其演化。

3.我们提供了一个迭代算法,可以确保收敛到(局部)最优解(We provide an iterative algorithm that is guaranteed to converge to (local) optimal solutions to the proposed formulation.)。我们证明了算法的正确性和收敛性,并且证明了该算法具有较低的时间复杂度。我们还为一些实际问题提供了原则性的解决方案,例如如何确定社区的数量以及如何在动态网络中处理节点的添加和删除

我们使用了合成的和真实的数据集(包括博客数据集和论文合著数据集)来证明我们的框架与传统的方法相比在社区及其演变方面提供了更合理的结果。我们还展示了框架在动态网络中发现的一些有趣的见解(insights),这些见解不能直接从现有的方法中获得。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值