社区发现算法-Community Detection-NormalizeCut/Louvain/NMF/LPA

最新推荐文章于 2022-03-27 14:28:38 发布

泽泽馥泽泽

最新推荐文章于 2022-03-27 14:28:38 发布

阅读量7.1k

点赞数 3

分类专栏： Community Detection 文章标签： LPA Louvain NMF NormalizeCut

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Zhongsigen/article/details/83623497

版权

本文详细介绍了几种社区检测算法，包括正则化割(Normalized Cut)、Louvain算法、非负矩阵分解(NMF)和标签传播算法(LPA)。通过对图聚类的探讨，展示了这些算法的工作原理和应用场景，如图谱的模块度优化和数据点的聚类。文章还涵盖了算法的实现细节和实验比较。

摘要由CSDN通过智能技术生成

本文结构安排

图聚类简介
正则化割
Louvain
非负矩阵分解（NMF）
其他常见方法
图(graph):是一种由点和边集构成的结构 $G = (V, E)$
图聚类(graph clustering) : 将点划分为不同的簇，使得簇内的边尽量多，簇之间的边尽量少。也称为图划分(partitioning)，社区检查(community detection)

应用Louvain算法产生的社区检测图示

Normalized cut

正则化割的基本原理是使各簇之间的割最小，但不是算其最小割，因为这会使相对孤立的边缘点“自成一团”，造成社区大小的不均衡。算法的基本过程的前半部分类似于谱聚类，先由度矩阵和邻接矩阵，计算出拉普拉斯矩阵，得到第二小到K+1小的特征向量，对其进行K-means聚类，预处理得到k’个簇。之后，计算两两簇合并之后，计算其正则化割，选择正则化割最小的两个簇合并。每次合并减小一个簇，直到减小到K个簇。

k-路划分：

（1）计算相似度矩阵W和度矩阵D

（2）计算标准化拉普拉斯矩阵 $D^{-\frac{1}{2}}(D−W)D^{-\frac{1}{2}}$

（3）从第二小的特征值开始找 $k ’$ 个最小的特征值对应的特征向量构造 $\cdot k′$ 维度的特征矩阵F

（4）对特征矩阵F按行进行标准化后，进行Kmeans聚类得到 $k ’$ 簇

（5）在这 $k ’$ 个簇中，每次选取两个簇进行合并，直到最后剩下k个簇，选取的策略是最小化Ncut时的合并组合

Louvain

Louvain算法的基本原理也是采用合并的策略，但是它合并的标准是模块度增益。首先将每个节点初始化为不同社区，计算将节点加入其邻居社区的模块度增益△Q，选择使模块度增益最大的邻居进行合并，合并后的社区看做一个新的节点，直到两两社区合并的模块度增益都不大于0，则停止合并。

Louvain算法步骤如下：

（1）初始化每个数据点为一个社区；

（2）对每个数据点，尝试加入其邻居所在的社区，计算比较加入前后的模块度增益ΔQ，选出增益最大的那个邻居社区，若其对应的增益ΔQ>0，则该数据点加入这个社区，否则不改变其原来社区划分；

（3）将得到的社区视为一个节点，社区内节点之间边权重转化为新节点环的权重，社区间的边权重转化为新节点间的边权重；

（4）重复（2）（3）步骤，直至满足收敛条件。

收敛条件可以是迭代了一定的次数，亦或是模块度不再增加。

NMF

最低0.47元/天解锁文章

泽泽馥泽泽

关注

3
点赞
踩
20

收藏

觉得还不错? 一键收藏
0
评论
社区发现算法-Community Detection-NormalizeCut/Louvain/NMF/LPA

本文结构安排图聚类简介正则化割Louvain非负矩阵分解（NMF）其他常见方法图(graph):是一种由点和边集构成的结构G=(V,E)G=(V,E)G=(V,E)图聚类(graph clustering) : 将点划分为不同的簇，使得簇内的边尽量多，簇之间的边尽量少。也称为图划分(partitioning)，社区检查(community detectio...
复制链接

扫一扫

专栏目录

泽泽馥泽泽 CSDN认证博客专家 CSDN认证企业博客

码龄8年

14: 原创

33万+: 周排名

126万+: 总排名

2万+: 访问

: 等级

401: 积分

8: 粉丝

6: 获赞

4: 评论

35: 收藏

私信

关注

热门文章

分类专栏

最新评论

推荐系统-Recommendation System-CF/SlopeOne/MF
爱读书的小寿星: 博主你好，那后面的推荐列表该怎么写呢？我想了下，您的数据用的是根据已知评分的DataFrame，那推荐列表的话应该是需要每个userId和所有的productId的数据，所以应该需要把userId和productId做笛卡尔积，而且还要加上score评分，作为一个新的DataFrame，这里面有的score有数据，有的是null，那这个代码可能要判断下是不是null? 想问下博主，如果要做推荐列表的思路，谢谢
用于无监督域自适应的域共享组-稀疏字典学习
xipeng523: 请问这个有源代码吗
论文阅读-Attention-based Transactional Context Embedding for Next-Item Recommendation
congwanwang2448: 请问一下Attention-based Transactional Context Embedding for Next-Item Recommendation这篇文章的作者有开源实验代码吗？
网络嵌入算法-Network Embedding-LINE/LANE/M-NMF
李偉: 2018年ACM CSUR综述文章“Spatio-Temporal Data Mining: A Survey of Problems and Methods”中提到三篇Network-based representations文章，可关注 1. Cross-species analysis of biological networks by Bayesian alignment. PNAS 2006, 103, 29, 10967–10972. 2. Comparing networks from a data analysis perspective. In CCS. Springer, 2009, 1907–1916. 3.S. Soundarajan et al. 2013. Which network similarity measure should you choose: an empirical study. In Workshop on Information in Networks, New York, USA.

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。