louvain算法_infoMap分群以及与 Louvain 效果对比

最新推荐文章于 2022-02-17 17:47:28 发布

weixin_39628380

最新推荐文章于 2022-02-17 17:47:28 发布

阅读量628

点赞数

文章标签： louvain算法

谈到社区发现算法，不得不提 infoMap。infoMap 思想新颖，速度快，在业界已有广泛的应用。本文简单介绍 infoMap 的原理，然后实验亲测与 Louvain 分群效果对比。

1）infoMap 原理

介绍原理之前，先说明两个直觉上的常识：1. 图中连接紧密的节点直觉上更容易认为是群； 2. 图中随机游走时，若节点间转换的概率一样，则随机游走在群内停留时间更长。基于以上两个常识，infomap 将分群巧妙地转化为最小随机游走编码长度问题。

随机游走首先形成的是节点序列，然后各个节点需要通过编码来区分。最简单的编码是二进制编码，比如图中四个节点，则编码分别为"00", "01", "10", "11"。由于图中各节点连接的边数量不同，随机游走序列中某些节点出现次数多，某些少。高级点的编码采用 HuffMan 编码，出现次数多的靠近 huffman 树根编码长度短，这样可以缩小整个序列的编码长度。infoMap 的想法是将每个节点的编码分为两个部分模块码和节点码，模块码用于区分图中不同的群，节点码用于区分相同模块内不同节点。不同模块节点的模块码不同，但节点码可能相同。如下图所示：