社区发现研究报告——基于信息熵和局部相关性的多标签传播重叠社区发现算法

本文提出了一种改进的重叠社区发现算法COPRA-EP,该算法结合信息熵和局部相关性,通过异步更新策略提升社区划分的稳定性和质量。实验结果显示,COPRA-EP在多数情况下优于其他算法,特别是在社区质量(Qov)和归一化互信息(NMI)指标上。
摘要由CSDN通过智能技术生成

                                                       基于信息熵和局部相关性的多标签传播重叠社区发现算法

摘要:是一种对COPRA算法进一步改善的算法。本文提出一种基于信息熵和局部相关性的多标签传播重叠社区发现算法。该算法在标签传播阶段,采用异步更新策略,利用信息熵产生更新序列指导标签更新,解决社区划分结果不稳定问题。同时在标签选择阶段,根据节点与自我网络中其他节点的相关程度选择标签,提高所发现社区的质量。

 

引言

COPRA算法能够适应当前大规模社会网络的社区发现工作[2],但是由于标签传播算法的随机性,导致多次运行结果会有较大程度的差异,且社区划分质量不高,甚至出现错误的社区划分。因此,本文针对现有基于标签传播思想的重叠社区发现算法存在的问题进行改进,提高社区划分精度和生成社区的质量。

 

基于信息熵和局部相关性的多标签传播重叠社区发现算法(COPRA-EP

 

2.1  COPRA-EP的算法描述

 

 

2.2  COPRA-EP的预备知识及定义

(1)   即为式(1)

                                        

其中,L{v,N(v)}表示节点v及其邻居节点拥有的标签集合;N(v)表示节点v的邻居节点;p(l)表示标签l在集合中出现的概率

注意:节点v的熵值[3]越小,该节点越可能处于社区内部;反之亦然。本文采用社区背部节点先于社区边缘节点

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值