关于为什么pagerank能收敛
pagerank的主要思想
- 如果一个网页被很多其他网页链接到的话说明这个网页比较重要,也就是PageRank值会相对较高
- 如果一个PageRank值很高的网页链接到一个其他的网页,那么被链接到的网页的PageRank值会相应地因此而提高
算法原理
PageRank算法是互联网中的众多网页看做是一个有向图,如上图所示。算法过程是把网页预先给网页一个PR值(一般取 1 N \frac{1}{N} N1, N 为网页总数)。然后通过以下公式不断更新PR值,直到收敛:
P R ( p i ) = α ∑ p j ∈ M p i P R ( p j ) L ( p j ) + 1 − α N PR(p_i) = \alpha \sum _{p_j \in M_{p_i}} \frac{PR(p_j)}{L(p_j)} + \frac{1-\alpha}{ N} PR(pi)=α∑pj