2008年,华盛顿大学生物系的 Carl T. Bergstrom 教授和 Martin Rosvall 在 PNAS 上发表了 Maps of random walks on complex networks reveal community structure 一文,旨在解决有向有权图上的 Community Detection 问题。对于这篇论文的原理,这篇博文做出了非常清晰的解读:最小熵原理(五):“层层递进”之社区发现与聚类。作者从信息论的视角出发,将有向有权图上的社区发现问题转化为随机行走产生路径的最小编码问题,即一个优化问题,提出了两层编码的策略。这种方法被称为 Map Equation 或 infomap ,代表了 Community Detection 中的不需要图重建的众多方法中的一类。
在原始的方法中,该方法仅具有一个超参,即随机跳转概率。而对该方法的改进,着眼于如何发现不同聚类颗粒度的结构。2012年发表的 Encoding dynamics for multiscale community detection: Markov time sweeping for the map equation 一文中提出,在 Map Equation 算法中,通过调整随机游走的 Markov time 可以实现不同颗粒度的社区的发现,该论文中(似乎是)基于连续时间的 Markov chain encoding 。而我们要读的文献 efficient community detection of network flows for varying markov times and bipartite networks 中,对2012年的论文的改进在于,将离散时间与连续时间的 Markov chain encoding 进行比较, 指出调整 Markov Time 实质上是对图中不同类型的边进行了加权,使得通过调整这一权值,即 Markov time,可以实现不同颗粒度的社区的发现——较小的 Markov time 发现出的社区规模较小,而较大的 Markov time 发现出的社区规模较大。