最近刚刚给女朋友讲了讲page rank算法的原理,思虑再三,写个demo记录一下,算是掌握这个经典的证明吧。
pagerank是用于计算页面质量的,最最最开始的google在做搜索结果排序的时候,是根据页面质量的高低进行排序的。而衡量页面质量,对于google来说,方法就是衡量这个页面是否被其他“很好”的页面指向的次数“很多”。
于是,就把这个想法翻译一下,页面质量用分数衡量,假定A页面分数为a,A->B,那么B页面的分数应该是本来的B页面分数加上A给B页面的加分。
这是一个递归算法,在这个递归方法中,我们已经找到了规则,那么,如何去找最初的页面分数呢?这是一个鸡和蛋的故事......
page的贡献在于证明了矩阵计算的收敛性。
python demo 代码如下: