什么是pagerank
- pagerank是谷歌提出的算法,用来衡量特定网页相对于搜索引擎索引中的其他网页而言的重要程度
- pagerank实现了将 链接价值概念作为排名因素
算法理解:
- 入链 : 投票
- 让链接来投票,到一个网页的超链接相当于对这个网页投了一票
- 入链数量:
- 如果一个页面节点接收到的其他网页指向的入链数量越多,那么这个网页越重要
- 入链质量:
- 指向页面A的入链质量不同,质量高的页面会通过链接向其他页面传递更多的权重,所以越是质量高的页面指向页面A,则页面A越重要
按照入链数来算,上图中B最大
开始的时候每个页面的权重都是1,
获取当前票面值 = sum(出链点票面值/出链点出链数 )
上图中C最大
- 初始值
- 谷歌的每个页面设置相同的页面价值,即pr值
- pagerank算法给每个页面的pr初始值为1
- 迭代计算
- 谷歌不断的重复计算每个页面的pagerank,那么经过不断的重复计算,这这些页面的pr值会趋于稳定,也就是收敛