论文阅读心得一~ Finding and evaluating community structure in networks

老师说,写论文就像生孩子,可是对现在的我来说,读论文就像怀孩子,连婚都没结,怎么怀孩子?

关于社区发现,其实就是一个笼统的概念,把一个网络,现阶段都是复杂网络和重叠的大型网络了,划分成小的团体和组合。内部联系越紧密越好,社区和社区之间的联系尽可能少。

万丈高楼平地起,必须从开头开始做。先把newman 的一套算法思想搞通再说吧。

Newman 的经典之作当然是 Finding and evaluating community structure in networks 了,介绍了社团发现的两种基本思想:

1.agglomerative methods,凝聚算法,这类方法从一个个孤立的节点开始,计算每两个节点的相似度(按照一定的算法,本文没有介绍),相似度高则这两个节点在同一个社团。这种方法的问题在与社团中核心节点往往具有很高的相似度,但是边缘节点则容易被忽略。

2. divisive methods,分裂算法,算法步骤:

   (1)计算网络中所有边的betweenness 

   (2)移除betweenness最大的边。这里 删除边并不是要在真实的网络中切断节点之间的已存在的联系,而是为了寻找图中的社区。

   (3)重新计算所有边的betweenness

   (4)重复步骤2直到没有边剩余。

算法的第三步,即每删除一天betweenness最大的边后,要重新计算剩下的图的所有边的betweenness,计算量很大,但可以提高结果的准确性。


那么问题来了,我们要删除哪些边?

A2:不同的算法会有不同的方式,基于社区的重要特征(社区内部联系紧密,社团之间联系松散),Newman提出删除具有最大"betweenness"的边。

Newman将‘betweenness’解释为连接社团之间(而不是社团内部)节点的度量。我们要做的是找到betweenness最大的边,删除它,直到找出所有community,这是一个循环迭代的过程。

怎么计算betweenness呢?

Newman提出3种计算betweenness的方法:1.找出网络中每两个节点之间的最短路径,最短路径会有重合的边,那么经过某条边的最短路径重合次数就代表它的betweenness。2和3方法一种是randomwalk betweenness,一种是current-flow betweenness,本质上是一样的,相较于第一种方法,2,3复杂度大而且精确度低,后面对该论文的引用也大多是对第一种方法的改进和使用。

酝酿...


  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值