数据挖掘实验（pagerank）

最新推荐文章于 2024-07-12 16:26:30 发布

Langu1d

最新推荐文章于 2024-07-12 16:26:30 发布

阅读量93

点赞数

文章标签：数据挖掘 python

本文链接：https://blog.csdn.net/m0_63598618/article/details/130307742

版权

import numpy as np

# 设置确定随机跳转概率的a、网页结点数N
a = 0.85
N = 6

# 初始化随机跳转概率的矩阵
jump = np.full([2,1], [[a], [1-a]], dtype=float)

# 邻接矩阵的构建
adj = np.full([N,N], [[0,0,0,0,0,0],[1,0,0,0,0,1],[1,1,0,1,0,0],[1,1,1,0,0,1],[0,0,0,0,0,0],[0,1,0,1,1,0]], dtype=float)

# 对邻接矩阵进行归一化
row_sums = adj.sum(axis=1)      # 对每一行求和
row_sums[row_sums == 0] = 0.1   # 防止由于分母出现0而导致的Nan
adj = adj / row_sums[:, np.newaxis] # 除以每行之和的归一化

# 初始的PageRank值，通常是设置所有值为1.0
pr = np.full([1,N], 1, dtype=float)

# PageRank算法本身是采样迭代方式进行的，当最终的取值趋于稳定后结束。
for i in range(0, 38):

    # 进行点乘，计算Σ(PR(pj)/L(pj))
    pr = np.dot(pr, adj)

    # 转置保存Σ(PR(pj)/L(pj))结果的矩阵，并增加长度为N的列向量，其中每个元素的值为1/N，便于下一步的点乘。
    pr_jump = np.full([N, 2], [[0, 1/N]])
    pr_jump[:,:-1] = pr.transpose()

    # 进行点乘，计算α(Σ(PR(pj)/L(pj))) + (1-α)/N)
    pr = np.dot(pr_jump, jump)

    # 归一化PageRank得分
    pr = pr.transpose()
    pr = pr / pr.sum()

    print("round", i + 1, pr)

Langu1d

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
数据挖掘实验（pagerank）

转置保存Σ(PR(pj)/L(pj))结果的矩阵，并增加长度为N的列向量，其中每个元素的值为1/N，便于下一步的点乘。row_sums[row_sums == 0] = 0.1 # 防止由于分母出现0而导致的Nan。# 进行点乘，计算α(Σ(PR(pj)/L(pj))) + (1-α)/N)row_sums = adj.sum(axis=1) # 对每一行求和。# PageRank算法本身是采样迭代方式进行的，当最终的取值趋于稳定后结束。# 进行点乘，计算Σ(PR(pj)/L(pj))
复制链接

扫一扫