pagerank

PageRank算法[编辑]
简易版本[编辑]
假设一个由4个网页组成的群体:A,B,C和D。如果所有页面都只链接至A,那么A的PR(PageRank)值将是B,C及D的Pagerank总和。

PR(A)=PR(B)+PR(C)+PR(D)

PR(A)=PR(B)+PR(C)+PR(D)
继续假设B也有链接到C,并且D也有链接到包括A的3个页面。一个页面总共只有一票。所以B给每个页面半票。以同样的逻辑,D投出的票只有三分之一算到了A的PageRank上。

PR(A)=PR(B)2+PR(C)1+PR(D)3

换句话说,根据连出总数平分一个页面的PR值。

PR(A)=PR(B)L(B)+PR(C)L(C)+PR(D)L(D)

最后,所有这些被换算为一个百分比再乘上一个系数 {\displaystyle d} d。由于“没有向外链接的页面”传递出去的PageRank会是0,所以通过数学系统给了每个页面一个最小值
(1d)/N

PR(A)=(PR(B)L(B)+PR(C)L(C)+PR(D)L(D)+)d+1dN

要注意在Sergey Brin和Lawrence Page的1998年原文中给每一个页面设定的最小值是
1d
,而不是这里的
(1d)/N
。 所以一个页面的PageRank是由其他页面的PageRank计算得到。不断的重复计算可以得到所有网页的PageRank。如果给每个网页一个随机PageRank值(非0),那么经过不断的重复计算,这些页面的PR值会趋向于稳定,也就是收敛的状态。这就是搜索引擎使用它的原因。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值