目录
算法简介
PageRank算法基于
“从许多优质的网页链接过来的网页,必定还是优质网页”的回归关系,来判定网页的重要性
。
有以下两个影响因素:
•
数量因素
:一
个页面节点接收到的入链数量越多,这个页面越重要
•
质量因素:指向页面
A
的入链质量不同,越是质量高的页面指向页面
A
,则页面
A
越重要
算法原理
•
假设一个由4个网页组成的群体:A,B,C和D。如果所有页面都只链接至A,那么A的PR(PageRank)值将是B,C及D的Pagerank总和。

•
重新假设B链接到A和C,C只链接到A,并且D链接到全部其他的3个页面。一个页面总共只有一票。所以B给A和C每个页面半票。以同样的逻辑,D投出的票只有三分之一算到了A的PageRank上。