图聚类算法总结

最新推荐文章于 2024-07-09 09:58:25 发布

・T・T・

最新推荐文章于 2024-07-09 09:58:25 发布

阅读量1k

点赞数 23

文章标签：聚类人工智能数据挖掘

本文链接：https://blog.csdn.net/weixin_44921693/article/details/136661049

版权

论文： A new attributed graph clustering by using label propagation in complex networks

分类

现有的社区检测算法分为两类:1)非属性图主要关注基于节点的连通性结构，忽略节点的属性;2)属性图同时处理结构和属性信息。非属性图分为四大类:a)层次聚类，b)基于模块化的方法，c)基于随机游走的方法，d)基于标签传播的算法，属性图分为四大类:a)边缘加权，b)增广图，c)质量函数优化，d)统一距离。

非属性图

分层聚类

任何分层聚类方法的出发点都是相似性度量的定义，层次聚类方法可以分为两类，即聚类算法和分裂算法。

基于随机游走的方法

在随机行走方法中，每个节点最初包含一个行走器。然后每个步行者将随机选择它当前所在节点的邻居进行定位。

基于模块化的方法

尝试基于模块化度量来检测社区。这些方法假定对于分离良好的社区具有较高的模块化值。显然，将n个节点划分为k个非空群的方法个数由第二类斯特林数(k)给出;因此，不同的社区划分数是贝尔数。因此，证明了模块化优化是一个np完全问题。所有基于模块化的方法的目的都是发现网络的一个分区，从而使模块化值最大化。提出的模块化最大化方法可分为三大类:基于贪婪的方法、启发式方法和频谱优化方法

标签传播算法(Label propagation algorithm, LPA)

是Raghavan等人(2007)提出的一种流行且快速的社区检测方法。最初，为网络中的每个节点分配一个唯一的标签。在下一步中，每个节点使用其邻居中出现频率最高的标签更新其标签。当邻居的一些标签出现频率相同时，算法随机选择出现频率最高的标签。这个标签传播重复这个过程，直到具有相同标签的节点被分组到一个社区中