图算法提供了理解,建模和预测复杂动态的手段,例如资源或信息流,传染或网络故障传播的途径,以及群体的影响和弹性。
本博客系列旨在帮助您更好地利用图形分析和图形算法,以便您可以使用Neo4j等图形数据库更快地有效地创新和开发智能解决方案。
上周我们继续研究社区检测算法,重点关注弱连通分量算法。
本周我们将继续探索社区检测算法,并查看标签传播算法,该算法基于邻域多数传播标签作为推断群集的方法。这种极快的图形分区几乎不需要先验信息,因此被广泛用于大规模网络中进行社区检测。
关于标签传播
标签传播算法(LPA)是一种用于在图中查找社区的快速算法。它仅使用网络结构作为指导来检测这些社区,并且不需要预定义的目标函数或关于社区的先前信息。
LPA的一个有趣特性是您可以选择分配初步标签以缩小生成的解决方案的范围。这意味着您可以将其用作查找社区的半监督方式,您可以在这些社区中挑选一些初始社区。
LPA是一种相对较新的算法,仅由Raghavan等人提出。2007年,在文章“ 近线性时间算法检测大规模网络中的社区结构”中。它的工作原理是在整个网络中传播标签,并根据标签传播过程形成社区。
该算法背后的直觉是,单个标签可以在密集连接的节点组中迅速成为主导,但是它将难以穿过稀疏连接的区域。标签将被捕获在密集连接的节点组内,并且当算法完成时最终具有相同标签的那些节点被视为同一社区的一部分。