1.传统算法
1.1算法描述
Triangle Count在社交网络分析中是非常有用的。这个三角形是一个三结点的小图,其中结点两两相连。假如,在Facebook上,你认识两个校友,而这两个校友彼此有相互认识,那么你们三个就组成了一个三角形。像这样的,社交网络拥有越多的三角形,其联系也就业紧密。Triangle Count的算法思想如下:
- 计算每个结点的邻结点,
- 统计对每条边计算交集,并找出交集中id大于前两个结点id的结点,
- 对每个结点统计Triangle总数,注意只统计符合计算方向的Triangle Count。
假设结点A和结点B是邻居。结点A的邻结点集合是{B,C,D,E},结点B的邻结点集合是{A,C,E,F,G},而它们的交集是{C,E}。交集中的结点是结点A和结点B的共同邻结点,所以有{A,B,C}和{A,B,E}两个三角形。
1.2算法实现
def triangleCount(graph):
count = 0
tringle = []
for srcId in graph:
srcSet = graph.get(srcId)
for destId in srcSet:
if (destId > srcId):
destSet = graph.get(destId)
for vertexId in destSet:
if(vertexId in srcSet) and (vertexId > destId):
count += 1
tringle.append((srcId, destId, vertexId))
print("===================================")
print("Triangle Count: ", count)
print(tringle)
if __name__ == "__main__":
#directed graph
graph = {0: [1, 2], 1: [2, 3], 2: [3], 3: []}
#undirected graph
graph = {0: [1, 2], 1: [0, 2, 3], 2: [0, 1, 3], 3: [1, 2]}
triangleCount(graph)
2.基于矩阵的实现
2.1算法描述
其实,我们换个角度思考,会发现Triangle Count的算法有一个更简单的方法:如果结点i既能通过一条路径到达结点j,又能通过两条路径到达结点j(假设经过的中间结点是k),那么结点i、j、k就可以构成一个三角形。如此一来,不由的就想起了邻接矩阵A,其
现在不用我多说,大家也都猜到了出现在A和相同位置中的非零值,就表示可以形成三角形,而非零值的个数即为Triangle Count。用公式表示为:
其邻接矩阵A和 分别是:
2.2算法实现
Python代码实现如下:from numpy.random import rand
import numpy as np
def init(dimension):
mat = np.zeros((dimension, dimension))
mat[(rand(dimension) * dimension).astype(int), (rand(dimension) * dimension).astype(int)] = 1
return mat
def triangleCount(adjacencyMat):
biAdjacencyMat = np.dot(adjacencyMat, adjacencyMat)
countIntersect = np.logical_and(adjacencyMat, biAdjacencyMat)
return countIntersect
if __name__ == "__main__":
adjacencyMat = np.array([[0, 1, 1, 0],
[0, 0, 1, 1],
[0, 0, 0, 1],
[0, 0, 0, 0]])
dimension = 4
adjacencyMat1 = init(dimension)
print(triangleCount(adjacencyMat))