本文由北京大学邵蓥侠,陈雷,崔斌老师发表论文
本文首先介绍了一种内聚子图k-truss,通过将其与k-core相比凸显其优良性,但是由于计算过程中巨大的通信开销和大量的迭代次数,所以k-truss的并行解决方案对于大型图的效率仍然有待改善。
本文提出了一种新颖的并行高效truss检测算法PETA,PETA算法为每个计算节点构造一个三角完整子图(TC子图)。根据TC子图,该算法可找到并行的局部k-truss。而来自TC子图的局部k-truss简单结合正好是全局k-truss。此外,该算法在连续迭代之间通过应用无缝检测避免了繁琐的三角计数(重新启动)。在新框架中,最高的通信开销有上限,而实际通信开销与无效三角的规模有关。总计算复杂度与著名有序算法和最小迭代次数相同。
实施PETA方法:
首先确定频率和边沿初始之间的幂律分布,即边支持法。边支持法确保了PETA可以在实际中有更少的图空间开销。此外,通过应用一个边均衡分区,这部分空间开销会进一步减少。构造三角完整子图并避免了无缝检测技术带来的多余计算。我们需要将广泛顶点中心模型扩展为面向子图的模型,面向子图的模型把局部子图(分区)看作最小的操作单元,并允许用户直接访问和更新局部图。
本文假设空子图是图G的k-truss(评断k),任何图G至少有一个k-truss来评断k。在图G可确保一个条件中只有一个Γk:对于固定阈值k,在图G中仅存在一个最大k-truss。通过计数边e周围的三角简单计算了θ(e)。两种解决方案基本操作说明如下:
1、经典解决方案:按照ID的升序对每条顶点的邻点进行排序。对于边(u,v),算法可计算O(d(