Finding Tenuous Groups in Social Networks - 2018

概述

这是18年关于社区稀疏子图的一篇文章。文章指出,以k-line作为核心的指标,提出了KMLA算法来衡量图的稀疏程度。文章与MKTG1的方法进行对比(见之前分享过的文章On Finding Socially Tenuous Groups for Online Social Networks),认为本文提出的方法,在某些场景上找到更好的稀疏子图,同时有着更好的效率。

1)结果的稀疏程度比较
在这里插入图片描述

文章提出了上面这样一个场景,并认为节点1和2,根据MKTG的方法,可能存在最终的稀疏子图中包含了节点1和节点2的可能。

Nodes 1 and 2 in Fig.1 might be chosen in a tenuous group since they may not form a k-triangle (k=2) according to the problem definition in [1]. However, we can easily see that nodes 1 and 2 interact with each other heavily. If a graph has many node-pairs with similar structure as nodes 1 and 2, the nodes group generated in [1] is not a tenuous group. The main reason for this limitation is that k-triangle is not a good measurement of tenuity in some cases.

然而根据之前分享的TERA算法的具体流程,先画出 G k G_k Gk。显然,包含节点1和节点2的k-triangle数量是图中最多的,因此,根据算法,也是最先被剔除的两个节点。所以也应该不会出现最终稀疏子图中包含1,2节点的情况。这里是对于文章比较疑惑的一个地方。
在这里插入图片描述

问题定义

1)问题定义:给定一个社交网络G,根据所需要找到的子图规模S,稀疏参数K,找到一个子图F,使得|F|等于S,并且该子图 L k ( F ) L_k(F) Lk(F)最小。

L k ( F ) L_k(F) Lk(F)为图F中k-line的数量

2)衡量指标: L k ( F ) L_k(F) Lk(F)

3)算法:KLMA

算法介绍

算法分成两个部分,第一部分是获取图G的一个最大的不包含的kline子图F。第二部分是,如果第一部分的|F|<S,则需要从G中挑选节点放入F中,同时保证 L k ( F ) L_k(F) Lk(F)最小。

1)寻找最大的不包含kline子图F

文章提到了两种寻找F的方法。

1-1)KLMA-1-MCP
在这里插入图片描述
在这里插入图片描述
以上面这个图为具体的例子。图a是即是图G,k=2。构造 G k G_k Gk(如果在图G中任意连点之间的最短距离小于等于k,则 G k G_k Gk中这两点在之间有边),即图b。取图b的补图,图c。图c中的完全连通子图的节点集,该节点任意两点,在b中都不会相连,也就是没有kline。因此,从图c中找到最大完全连通子图,就是找到最大的不包含kline子图F。

MCP2是精确算法,但是在节点规模比较大的时候消耗的时间比较大,在本文是作为一个baseline算法。

1-2)KLMA-1-Greedy
在这里插入图片描述
采用贪心的方式,按照的一定的方式计算权值(按照每个节点的邻居数的倒数,或者按照与节点形成kline的节点数的倒数),每次从集合中取一个权重最大的节点放入F中,原图删除相关的节点和边之后,重新计算权值,重复执行至得到集合F。

2)在得到F的基础之上,从G图中挑选节点放入F中,直至|F|=S,同时保证 L k ( F ) L_k(F) Lk(F)最小

在这里插入图片描述

2-1)|F|>=S,从F中挑选S个节点即可。

2-2)|F|<S

对于G中没被选入F的节点,计算其加入F中后,kline增加的数量。每一轮都取kline边际递增最小的节点进入F中,直至|F|=S。

实验部分

实验主要分为三个部分:

1)比较不同参数k和节点规模S下,三种获取F集合的速度快慢。

2)KLMA和MKTG两种方法在不同的数据集下面的表现如何,包括:

2-1)在我们需要输出的规模参数下,得到的kline的数量(代表了结果的稀疏程度)

2-2)在我们需要输出的规模参数下,执行的时间的长度(代表了执行所消耗的时间)

3)在真实的数据集当中,根据不同的K值大小,通过第一阶段能够得到的符合no kline的集合的大小


  1. Shen C Y, Huang L H, Yang D N, et al. On Finding Socially Tenuous
    Groups for Online Social Networks[C]// The, ACM SIGKDD
    International Conference. ACM, 2017:415-424. ↩︎

  2. Johnston, H. C. Cliques of a graph-variations on the Bron-Kerbosch
    algorithm[J]. International Journal of Computer & Information
    Sciences, 1976, 5(3):209-238. ↩︎

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值