python机器学习手写算法系列——PageRank算法

本文详细介绍了PageRank算法的工作原理,通过一个实例展示了算法的迭代过程,并提供了Python代码实现。在一系列迭代后,得出各页面的PageRank得分。
摘要由CSDN通过智能技术生成

Page Rank

Page Rank 是谷歌搜索的网页排名算法。PageRank是以谷歌创始人Larry Page命名的。(只能说是个巧合,敢不敢叫Larry Rank)

算法

PageRank算法假设,一个用户在互联网上随机跳转到别的page。他要求用户最终到达某个page的概率。

例子

我找到的最好的例子就是下面这个:

PageRank Algorithm - Example(YouTube)

如果你的网络有问题,访问不了,没关系,我会详细讲解。

探索

我们有以下的有向图,每个节点代表一个页面,每条有向边代表从一个page到另一个page的链接。
PageRank

Iteration 0

第0次遍历,在一开始,用户随机访问这4个page的概率,当然是1/4。

Iteration 1

在遍历1, 用户在遍历0的基础上,跳转到另一个page。

Page A

PageRank
对于Page A,唯一访问它的就是Page C。但是Page C同时也指向B和D,所以从C出发,到达A的概率是1/3。而之前我们算过了,只有1/4的用户访问了C,两者结合,就是1/4*1/3=1/12 = 0.08333333333333333。

B

在这里插入图片描述

对于B来说,情况稍微复杂了一点。因为有A和C都指向B。

我们先只考虑A->B,因为A同时指向B和C,所以从A出发,到达B的概率是1/2。考虑Iteration 1 的 A的概率是1/4。则用户先访问A,再访问B的概率是1/2 * 1/4 = 1/8

同理,用户先访问C,再访问B的概率是
1/3 * 1/4 = 1/12

结合以上,用户在Iteration 1时,到达B的概率是
1/2 * 1/4 + 1/3 * 1/4 = 1/8 + 1/12 = 0.20833333333333334。

C

PageRank
我们用符号表示以上运算,则有:

P(C|I1) = P(C|A) * P(A) + P(C|D) * P(D) = 1/2 * 1/4 + 1 * 1/4 = 1/8+1/4=4.5/12=0.375

D

P(D|I1) = P(D|B) * P(B) + P(D|C

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

织网者Eric

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值