pagernk是对网页排名的算法,计算每一个网页的PageRank值,然后根据这个值(概率)的大小对网页的重要性进行排序。
思想:被大量高质量网页引用(链接)的网页也是高质量的网页。
比如网页Y被X1,X2,X3,X4四个网页所链接,且这四个网页的权重分别为0.001,0.01, 0.02, 0.04,则网页Y的rank值为 0.01 + 0.02 + 0.03 + 0.04 = 0.071
最简单的pagerank模型:
这个案例中,有四个节点,对于A节点,它有1/3的概率访问B,C,D,这3表示A的出度为3,对于B节点,它有1/2的概率访问A和D,等等。。以一个4*4的矩阵存入两两之间访问的概率